WO2016147654A1 - ルール生成装置、ルール生成方法及びルール生成プログラムを記憶する記録媒体 - Google Patents

ルール生成装置、ルール生成方法及びルール生成プログラムを記憶する記録媒体 Download PDF

Info

Publication number
WO2016147654A1
WO2016147654A1 PCT/JP2016/001456 JP2016001456W WO2016147654A1 WO 2016147654 A1 WO2016147654 A1 WO 2016147654A1 JP 2016001456 W JP2016001456 W JP 2016001456W WO 2016147654 A1 WO2016147654 A1 WO 2016147654A1
Authority
WO
WIPO (PCT)
Prior art keywords
rule
explanatory variable
value
prediction model
rule generation
Prior art date
Application number
PCT/JP2016/001456
Other languages
English (en)
French (fr)
Inventor
圭介 梅津
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2017506095A priority Critical patent/JPWO2016147654A1/ja
Publication of WO2016147654A1 publication Critical patent/WO2016147654A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Definitions

  • the present invention relates to a technique for generating a rule, and particularly to a technique for generating a rule used for determination.
  • Patent Document 1 An example of a technique for generating a rule is disclosed in Patent Document 1, for example.
  • Patent Document 1 describes an abnormal sign detection system that uses rules to infer the presence or absence of abnormal signs.
  • the rule in Patent Document 1 is represented by a conclusion part associated with a combination of attribute values.
  • the abnormal sign detection system of Patent Document 1 uses the case data to generate a rule.
  • One of the objects of the present invention is to provide a rule generation device capable of generating a rule for determining the occurrence of an event so that the rule can be selected according to the required performance.
  • a rule generation device generates a rule for determining whether or not the event occurs based on a combination of ranges of values of one or more explanatory variables that describe the event And a result of determining whether the sample in which the value indicating whether the event occurs and the sample associated with the value of the explanatory variable match the generated rule or not is determined for the set of samples. And a rule evaluation unit for calculating an index value representing the performance of the rule.
  • a rule generation method generates and generates a rule for determining whether or not the event occurs based on a combination of ranges of values of one or more explanatory variables that describe the event. Based on the result of the determination on the set of samples, whether or not the sample in which the value indicating whether or not the event occurs and the value of the explanatory variable are matched with the rule is matched, An index value representing the performance of the rule is calculated.
  • the rule generation program generates a rule for determining whether or not the event occurs based on a combination of ranges of values of one or more explanatory variables that describe the event.
  • a rule generation means for determining whether or not a sample associated with a value representing whether or not the event occurs and a value of the explanatory variable are matched with the generated rule. Based on the determined result, it operates as a rule evaluation unit that calculates an index value representing the performance of the rule.
  • the present invention has an effect that a rule for determining the occurrence of an event can be generated so that the rule can be selected according to the required performance.
  • FIG. 1 is a block diagram illustrating an example of a configuration of a determination system according to first, second, and third embodiments of the present invention.
  • FIG. 2 is a diagram schematically illustrating an example of a prediction model stored in the prediction model storage unit according to the first embodiment of this invention.
  • FIG. 3 is a diagram schematically illustrating a prediction model based on heterogeneous mixed learning.
  • FIG. 4 is a diagram schematically illustrating a prediction model represented by a tree structure based on heterogeneous mixed learning, which is stored in the prediction model storage unit according to the first embodiment of this invention.
  • FIG. 1 is a block diagram illustrating an example of a configuration of a determination system according to first, second, and third embodiments of the present invention.
  • FIG. 2 is a diagram schematically illustrating an example of a prediction model stored in the prediction model storage unit according to the first embodiment of this invention.
  • FIG. 3 is a diagram schematically illustrating a prediction model based on heterogeneous mixed learning.
  • FIG. 5 is a diagram schematically illustrating a prediction model represented by a tree structure based on heterogeneous mixed learning, which is stored in the prediction model storage unit according to the first embodiment of this invention.
  • FIG. 6 is a diagram schematically illustrating an example of parameters stored in the parameter storage unit according to the first embodiment of this invention.
  • FIG. 7 is a diagram schematically illustrating another example of parameters stored in the parameter storage unit according to the first embodiment of this invention.
  • FIG. 8 is a diagram schematically illustrating an example of a sample stored in the sample data storage unit according to the first embodiment of this invention.
  • FIG. 9 is a diagram schematically illustrating an example of index values presented by the rule presentation unit according to the first embodiment of this invention.
  • FIG. 10 is a diagram schematically illustrating an example of the index value calculated from the determination result based on the integration rule.
  • FIG. 11 is a flowchart illustrating an example of the operation of the determination system according to the first embodiment of this invention.
  • FIG. 12 is a flowchart showing an example of the operation of the determination system according to the first, second, and third embodiments of the present invention.
  • FIG. 13 is a flowchart illustrating an example of the operation of the determination system according to the second embodiment of this invention.
  • FIG. 14 is a flowchart illustrating an example of the operation of the determination system according to the third embodiment of this invention.
  • FIG. 15 is a flowchart illustrating another example of the operation of the determination system according to the third embodiment of this invention.
  • FIG. 11 is a diagram schematically illustrating an example of the index value calculated from the determination result based on the integration rule.
  • FIG. 11 is a flowchart illustrating an example of the operation of the determination system according to the first embodiment of this invention.
  • FIG. 16 is a block diagram illustrating an example of a configuration of a rule generation system according to the fourth embodiment of this invention.
  • FIG. 17 is a diagram illustrating an example of a hardware configuration of a computer capable of realizing the rule generation device according to each embodiment of the present invention.
  • FIG. 18 is a block diagram illustrating an example of the configuration of the determination system according to the first, second, and third embodiments of the present invention implemented by a circuit.
  • FIG. 19 is a block diagram illustrating an example of a configuration of a rule generation system according to the fourth embodiment of this invention implemented by a circuit.
  • FIG. 20 is a flowchart illustrating an example of the operation of the rule generation system according to the fourth embodiment of this invention.
  • FIG. 1 is a block diagram showing an example of the configuration of the determination system 1 of the present embodiment.
  • the determination system 1 of the present embodiment includes a rule generation device 10, a learning device 20, a terminal device 30, and a determination device 40.
  • the rule generation device 10 is communicably connected to each of the learning device 20, the terminal device 30, and the determination device 40.
  • the direction in which data and the like are transmitted is not limited to the direction of the arrow shown in the figure.
  • the rule generation device 10 includes a rule generation unit 101, a rule evaluation unit 102, a rule presentation unit 103, a prediction model storage unit 104, a parameter storage unit 105, a sample data storage unit 106, and a prediction model transmission / reception unit 107.
  • a parameter receiving unit 108 and a rule transmitting unit 109 are included in The rule generation device 10 in the rule generation unit 101.
  • the prediction model storage unit 104 stores a prediction model.
  • the prediction model stored in the prediction model storage unit 104 is represented by, for example, a relationship between an objective variable and an explanatory variable that explains the objective variable.
  • the objective variable represents a variable related to the target event, such as the degree of possibility that an event related to the predetermined target will occur.
  • An explanatory variable represents a variable that affects an event related to an object, such as a situation, a property, an attribute, or a measurement result, for example, in the object or the environment.
  • the value of the explanatory variable is represented by a numerical value.
  • the value of the explanatory variable is a non-numeric value such as “sunny” or “rain” which is the value of the explanatory variable when the explanatory variable is weather, for example, the designer of the determination system 1 It is only necessary that a numerical value is assigned in advance to a value that is not a numerical value.
  • Target is, for example, a customer.
  • An event is, for example, a customer reacting to a promotion.
  • the sales promotion is, for example, notification by direct mail (for example, mail or e-mail) or Internet advertisement.
  • the reaction to the sales promotion is, for example, purchase of a product, visit to a store, participation in an event, access to an advertisement site, and the like.
  • the explanatory variables are, for example, the past number of reactions, the amount of money used in the past reactions, the number of days elapsed since the last reaction, the address, age, sex, holiday information, and the like.
  • the target may be, for example, a day that is a target for product demand forecast, power demand forecast, or store visit forecast.
  • the event may be, for example, that a product demand prediction, a power demand prediction, or a store visit number prediction that has been performed is significantly different.
  • the explanatory variables are past performance values, weather (for example, weather, temperature, precipitation, etc.), holiday information, event date information, campaign date information, and the like.
  • the past performance value is, for example, a daily product demand value, a power demand value, or a store visit value within a predetermined period in the past.
  • the target may be e-mail, for example.
  • the event is that the electronic mail is a junk mail (for example, junk mail).
  • the explanatory variables are the presence / absence of a specific word, the number of appearances of a specific word, the presence / absence of co-occurrence of a specific word set, the number of co-occurrence of a specific word, and the like.
  • the target may be, for example, a contracted user.
  • the event may be, for example, that the user cancels within a predetermined period.
  • the explanatory variables are an address, sex, age, contract period, service usage frequency in the past predetermined period, and the like.
  • the target may be, for example, a part that deteriorates when used.
  • the subject may be, for example, a tire that wears when used.
  • the event is that the part wears from a predetermined standard within a predetermined period.
  • the explanatory variables include the number of parts used, the part usage period, and the load on the parts.
  • the target may be, for example, a component that may fail.
  • the event may be, for example, a component failure within a predetermined period.
  • the explanatory variables are the number of parts used, the part usage period, the load on the parts, and the like.
  • the prediction model stored in the prediction model storage unit 104 represents, for example, a relationship between an objective variable that is a variable related to an event and an explanatory variable that is a variable that explains the objective variable.
  • the prediction model is, for example, a prediction model based on multiple regression analysis
  • the prediction model is represented by a first order polynomial (ie, multiple regression equation) of explanatory variables. That is, the prediction model is represented by a plurality of combinations of an identifier of an explanatory variable (hereinafter referred to as explanatory variable ID (Idification)) and a coefficient size of the explanatory variable.
  • explanatory variable ID Idification
  • FIG. 2 is a diagram schematically illustrating an example of a prediction model stored in the prediction model storage unit 104.
  • the example of the prediction model shown in FIG. 2 is a prediction model based on multiple regression analysis.
  • the explanatory variable ID is “explanatory variable name”.
  • the explanatory variables are “number of times” that is the number of times of responding to the sales promotion, “amount” that is the amount of money used in the response to the past sales promotion, and the number of days that have elapsed since the last reaction. Elapsed days ".
  • the prediction model is a prediction model based on heterogeneous mixed learning
  • the prediction model is represented by a tree structure in which multiple regression equations are assigned to leaf nodes and explanatory variables are assigned conditional expressions to nodes other than leaf nodes.
  • a prediction model based on heterogeneous mixed learning is represented by a set of conditional variable conditional expressions and multiple regression equations assigned to nodes included in a route from a root node to a leaf node.
  • one route from the root node to the leaf node represents one prediction model.
  • FIG. 3 is a diagram schematically showing a prediction model based on heterogeneous mixed learning.
  • Condition 1 and Condition 2 are conditional expressions related to any explanatory variable.
  • Prediction Formula 1, Prediction Formula 2, and Prediction Formula 3 are first-order polynomials for explanatory variables (that is, multiple regression equations as described above).
  • the multiple regression equation representing at least a part of the prediction model is also referred to as “prediction equation”.
  • the prediction model in the case where the condition 1 is False and the condition 2 is True is represented by “Condition 1 is False”, “Condition 2 is True”, and “Prediction Formula 1”.
  • the prediction model in the case where the condition 1 is false and the condition 2 is false is expressed by “condition 1 is false”, “condition 2 is false”, and “prediction formula 2”.
  • the prediction model in the case where the condition 1 is True is expressed by “Condition 1 is True” and “Prediction Formula 3”.
  • the tree structure shown in FIG. 3 represents three prediction models.
  • 4 and 5 are diagrams schematically showing a prediction model stored by the prediction model storage unit 104 and represented by a tree structure based on heterogeneous mixed learning.
  • FIG. 4 shows a tree structure and conditional expressions in nodes other than leaf nodes.
  • node number is a node number.
  • Leaf node indicates whether or not the node specified by the node number is a leaf node.
  • a node having a “leaf node” value of 1 is a leaf node.
  • a node having a “leaf node” value of 0 is not a leaf node.
  • “Explanation variables” and “threshold values” represent conditional expressions.
  • “Explanation variable” is an explanation variable ID (in the example shown in FIG. 4, an explanation variable name).
  • Theshold is a threshold for the value of the explanatory variable.
  • condition 1 in FIG. 3 in the node whose node number is 1 is an expression indicating that the explanatory variable “number of times” is smaller than the threshold value “5”.
  • condition 2 in FIG. 3 in the node whose node number is 2 is an expression representing that the explanatory variable “amount” is smaller than the threshold value “10000 (yen)”.
  • “Explanation variable” and “threshold value” illustrated in FIG. 4 represent conditional expressions whose value is True when the value of “explanation variable” is smaller than the value of “threshold value”.
  • “Next node number (smaller than threshold)” is the number of the next node when the value of the explanatory variable is smaller than the threshold (that is, when the conditional expression is True).
  • the “next node number (greater than or equal to the threshold)” is the number of the next node when the value of the explanatory variable is not smaller than the threshold (that is, when the conditional expression is False).
  • the tree structure is represented by “next node number (smaller than threshold)” and “next node number (greater than threshold)” of nodes other than leaf nodes.
  • FIG. 5 shows a prediction formula in the leaf node.
  • Node number is a node number of a leaf node.
  • Explanation variable name is an explanation variable ID which is the name of the explanation variable in the example shown in FIG.
  • Coefficient is the value of the coefficient of the explanatory variable in the prediction formula.
  • the node number, the explanatory variable name, and the coefficient are associated with each other.
  • An explanatory variable name and a coefficient associated with the same node number represent a prediction formula in the leaf node specified by the node number.
  • the prediction model storage unit 104 may store the explanatory variable ID of the explanatory variable included in the prediction model for each prediction model, instead of storing the entire prediction model.
  • storing the explanatory variable ID is also referred to as storing the explanatory variable.
  • the prediction model transmission / reception unit 107 receives a prediction model from the learning device 20.
  • the prediction model transmission / reception unit 107 stores the received prediction model in the prediction model storage unit 104.
  • the prediction model transmission / reception unit 107 may further transmit the prediction model stored in the prediction model storage unit 104 to the terminal device 30.
  • the terminal device 30 may receive the prediction model and display the received prediction model. Then, for example, the user of the rule generation device 10 who operates the terminal device 30 may set a “number of categories” and a “threshold number” to be described later for each explanatory variable included in the prediction model. In that case, the terminal device 30 transmits the set “number of categories” and “number of thresholds” to the parameter receiving unit 108 of the rule generation device 10.
  • the parameter receiving unit 108 receives “the number of categories” and “the number of thresholds” from the terminal device 30.
  • the parameter receiving unit 108 stores the received “number of categories” and “threshold number” in the parameter storage unit 105.
  • the parameter storage unit 105 stores parameters related to rule generation. Specifically, the parameter storage unit 105 stores parameters used for range division for each explanatory variable included in the prediction model stored in the prediction model storage unit 104.
  • the value range is divided into, for example, three or more ranges. Hereinafter, the number of ranges when the range is divided into three or more ranges is referred to as “number of categories”.
  • the value range is divided into two regions by a threshold value, for example.
  • the value range may be divided into two regions by each of a plurality of different threshold values. Hereinafter, the number of threshold values for dividing a value range into two regions is referred to as “threshold number”.
  • the parameter storage unit 105 may store the number of categories and the number of thresholds as parameters for each explanatory variable.
  • the parameter storage unit 105 may store an upper limit value and a lower limit value for each explanatory variable included in the prediction model stored in the prediction model storage unit 104.
  • the upper limit value and the lower limit value may be, for example, the upper limit value and the lower limit value of the boundary of the range when the range is divided into three or more ranges.
  • the upper limit value and the lower limit value may be the upper limit value and the lower limit value of the threshold value in the case where the value range is divided into two regions by each of the plurality of threshold values.
  • the parameter storage unit 105 may include an upper limit value and a lower limit value as parameters for each explanatory variable.
  • FIG. 6 is a diagram schematically illustrating an example of parameters stored in the parameter storage unit 105.
  • the parameters shown in FIG. 6 include the number of categories and the number of thresholds for each explanatory variable.
  • FIG. 7 is a diagram schematically illustrating another example of parameters stored in the parameter storage unit 105.
  • the parameters shown in FIG. 7 include the number of categories, the number of thresholds, the upper limit, and the lower limit for each explanatory variable.
  • the upper limit of FIG. 7 is the upper limit of the value in which the range of the explanatory variable represents the boundary of the region, and is the upper limit of the threshold for dividing the range of the explanatory variable into two ranges.
  • the lower limit in FIG. 7 is the lower limit of the value in which the range of the explanatory variable represents the boundary of the region, and the lower limit of the threshold for dividing the range of the explanatory variable into two ranges.
  • FIG. 7 is the example of the example shown in FIG.
  • the upper limit of the value in which the value range of the explanatory variable represents the boundary of the region is the same as the upper limit of the threshold value that divides the value range of the explanatory variable into two ranges.
  • the upper limit of the value in which the range of the explanatory variable represents the boundary of the region may be different from the upper limit of the threshold for dividing the range of the explanatory variable into two ranges.
  • the lower limit of the value in which the range of the explanatory variable represents the boundary of the region is the same as the lower limit of the threshold for dividing the range of the explanatory variable into two ranges.
  • the lower limit of the value in which the range of the explanatory variable represents the boundary of the region may be different from the lower limit of the threshold for dividing the range of the explanatory variable into two ranges.
  • the rule generation unit 101 Based on the parameters stored in the parameter storage unit 105, the rule generation unit 101 expresses the range of the explanatory variables stored in the prediction model storage unit 104 as a plurality of value ranges (hereinafter also simply referred to as “range”). ). Then, the rule generation unit 101 generates a rule element related to the explanatory variable based on the range obtained by dividing the range of the explanatory variable.
  • the rule element related to the explanatory variable is expressed by, for example, a conditional expression related to the value of the explanatory variable, and is true if the conditional expression is satisfied, and false if the conditional expression is not satisfied.
  • the rule element related to the explanatory variable based on the value range is, for example, a conditional expression that is true when the value of the explanatory variable is included in the range of the value and is false otherwise.
  • the rule generation unit 101 generates a rule element for each range obtained by dividing the range of explanatory variables. Hereinafter, the division of the range and the generation of the rule element will be described in more detail.
  • the rule generation unit 101 divides the range of the explanatory variable into C areas.
  • dividing the range of the explanatory variable into the same number of ranges as the number of categories is also referred to as division based on the number of categories.
  • the rule generation unit 101 sets the above upper limit and lower limit as the boundary of the range, and further, between the upper limit and the lower limit so that the number of ranges delimited by the set boundary is C. What is necessary is just to set the boundary of a range by an interval.
  • the rule generation unit 101 generates C ranges by dividing the region by the set boundary. For each of the generated ranges, the rule generation unit 101 generates a rule element in which an explanatory variable is included in the range.
  • the rule generation unit 101 divides the range of the explanatory variable A into three ranges. For example, one range boundary is set so that there are three ranges between the upper limit and the lower limit. For example, when the explanatory variable A is the explanatory variable “number of times”, the upper limit is 10 and the lower limit is 2, the rule generation unit 101 sets 10 as the upper limit and 2 as the lower limit as the boundary of the range. To do. In this case, the value range of the explanatory variable “number of times” is divided into three ranges of less than 2, less than 2, less than 10, and more than 10. That is, three ranges are generated.
  • the rule generation unit 101 does not set the boundary of the range between the upper limit and the lower limit because the same number of ranges as 3 as the number of categories are set. Then, the rule generation unit 101 has, as rules regarding the explanatory variable “number of times”, “number of times is less than 2”, “number of times is 2 or more and less than 10”, and “number of times is 10 or more”. 2 rule elements are generated.
  • the rule generation unit 101 does not have to generate a rule element based on the number of categories for the explanatory variable.
  • the number of categories of the explanatory variable indicates that the range of the explanatory variable is divided by one value.
  • the rule generation unit 101 may set the upper limit and the lower limit that are the same value as the boundary of the range.
  • the rule generation unit 101 may set, for example, the average of the upper limit and the lower limit as the boundary of the range.
  • the rule generation unit 101 sets the boundary of the range at equal intervals.
  • the rule generation unit 101 may set the range boundaries so that the range boundaries are equally spaced with respect to the logarithm of the value of the explanatory variable.
  • the rule generation unit 101 may set the range boundary according to another method for setting the range boundary that is determined in advance.
  • the rule generation unit 101 sets different T threshold values.
  • the rule generation unit 101 sets the upper limit and the lower limit as thresholds, respectively.
  • the rule generation unit 101 sets threshold values, for example, at equal intervals between the upper limit and the lower limit so that the number of threshold values is T.
  • the rule generation unit 101 divides the range of the explanatory variable into two ranges using the threshold values.
  • the rule generation unit 101 sets at least one of predetermined ranges among the two ranges generated by dividing the range of the explanatory variable into two for each of the different T threshold values.
  • a rule element is generated.
  • the rule generation unit 101 may generate a rule element “the value of the explanatory variable is equal to or greater than the threshold” as the rule element related to the explanatory variable based on a range equal to or greater than the threshold.
  • the rule generation unit 101 may generate a rule element “the value of the explanatory variable is less than the threshold” as the rule element related to the explanatory variable based on the range less than the threshold.
  • the rule generation unit 101 generates a rule element that “the value of the explanatory variable is equal to or greater than the threshold” based on the range that is equal to or greater than the threshold value.
  • a rule element “value is less than a threshold value” may be generated.
  • a group of rule elements generated based on a range equal to or greater than the threshold is referred to as a “first element group”.
  • a group of rule elements generated based on a range less than the threshold is referred to as a “second element group”.
  • the rule generation unit 101 sets three threshold values.
  • the rule generation unit 101 sets the upper limit and the lower limit as thresholds, respectively.
  • the rule generation unit 101 sets thresholds at equal intervals between the upper limit and the lower limit so that the number of thresholds is three.
  • the rule generation unit 101 sets the upper limit of 10 times and the lower limit of 2 times as threshold values.
  • the rule generation unit 101 sets the thresholds at equal intervals, for example, between the upper limit and the lower limit so that the number of thresholds is three. In that case, the rule generation unit 101 sets 6 times as the threshold value.
  • the rule generation unit 101 sets rule elements based on each of the generated threshold values.
  • the threshold is 2, 6, and 10 times
  • the rule generating unit 101 determines, for example, “the number of times is 2 or more”, “the number of times is 6 or more” for the explanatory variable “number of times”, And a rule element “the number of times is 10 or more” is generated.
  • the first element group described above is a group of rule elements “the number of times is 2 or more”, “the number of times is 6 or more”, and “the number of times is 10 or more”.
  • the rule generation unit 101 generates rule elements “the number of times is less than 2”, “the number of times is less than 6”, and “the number of times is less than 10” for the explanatory variable “number of times”. May be.
  • the above-described second element group is a group of rule elements “the number of times is less than 2”, “the number of times is less than 6”, and “the number of times is less than 10”.
  • the rule generation unit 101 may generate a rule element of the second element group in addition to the rule element of the first element group.
  • the rule generation unit 101 sets the threshold value so that the threshold value is equally spaced between the upper limit and the lower limit.
  • the rule generation unit 101 may set the threshold value so that the threshold values are equally spaced with respect to the logarithm of the threshold value.
  • the rule generation unit 101 may set the threshold according to another method for setting the threshold that is determined in advance.
  • the rule generation unit 101 generates a rule based on each rule element combination including at most one generated rule element for each explanatory variable included in the prediction model.
  • the prediction model is a prediction model based on multiple regression analysis
  • the prediction model is represented by a multiple regression equation as described above.
  • the rule generation unit 101 generates a rule for each combination of rule elements including at most one generated rule element for each explanatory variable included in the multiple regression equation. Generate.
  • the generated rule includes one of the three rule elements or the generated rule Does not include any of the three rule elements. Therefore, when the number of rule elements for the explanatory variable A is 3, (3 + 1) rules are generated for the explanatory variable A.
  • the explanatory variable B is included in the multiple regression equation and the number of rule elements for the explanatory variable B is 2, one of the two rule elements is included in the generated rule, or a generated rule Does not include any two rule elements. Therefore, when the number of rule elements for the explanatory variable A is 2, (2 + 1) rules are generated for the explanatory variable A.
  • a rule for a prediction model based on multiple regression analysis is a condition expression that is true when the determination for all rule elements included in the above combination of rule elements is true, and is false otherwise. expressed.
  • the rule element is a conditional expression.
  • a rule for a prediction model based on multiple regression analysis is represented by, for example, a logical product of all rule elements included in the combination of rule elements described above.
  • the prediction model is a prediction model based on heterogeneous mixed learning
  • the prediction model is represented by a combination of a conditional expression and a multiple regression expression.
  • the prediction model is based on a combination of a conditional expression in a node other than the leaf node and a multiple regression expression in the leaf node among the nodes on the path from the root node to the leaf node in the tree structure representing the prediction model. expressed.
  • one or more conditional expressions and multiple regression expressions on one path from the root node to the leaf node represent one prediction model.
  • the rule generation unit 101 selects, for example, one prediction model, and includes at most one generated rule element for each explanatory variable included in the multiple regression equation in the leaf node of the selected prediction model. Generate a combination of rule elements.
  • the method of generating rule element combinations in this case is the same as the method of generating rule element combinations when the prediction model is a prediction model based on multiple regression analysis.
  • the rule generation unit 101 further generates a rule for each combination of rule elements based on the combination of rule elements and the conditional expression of the selected prediction model.
  • the rule generation unit 101 generates a rule so that all rule elements included in the combination and all conditional expressions of the selected prediction model are true if they are true, and false otherwise. To do.
  • the rule generation unit 101 generates a conditional expression representing a logical product of all rule elements included in the combination of rule elements and all conditional expressions of the selected prediction model as a rule.
  • the rule generation unit 101 assigns a rule number to each generated rule. For example, the rule generation unit 101 may assign, as a rule number, a number that is uniquely determined for the rule among the rules presented by the rule presentation unit 103 described later.
  • the sample data storage unit 106 stores a plurality of samples that can be used for rule evaluation.
  • the sample is data including, for example, a value extracted from the object or the environment, a value obtained by measuring the object or the environment, a value obtained by converting them, and the like for each object.
  • the sample further includes information for each subject that further identifies whether an event related to the subject has occurred (ie, the correct answer).
  • FIG. 8 is a diagram schematically illustrating an example of a sample stored in the sample data storage unit 106.
  • sample number is a number assigned to the sample.
  • the sample number is used as an identifier that identifies the sample.
  • the “explanatory variable name” is used as an identifier of the explanatory variable.
  • the explanatory variable name includes the determination result (correct answer).
  • the value of the determination result (correct answer) indicates whether or not an event related to the object represented by the sample specified by the sample number has occurred.
  • the value of the discrimination result (correct answer) may represent the discrimination result by the sample creator. In the example shown in FIG. 8, when the value of the determination result (correct answer) is 1, an event related to the object occurs. When the value of the determination result (correct answer) is 0, no event related to the object occurs.
  • “Value” is the value of the explanatory variable.
  • the sample whose discrimination result (correct answer) is 1 is the data of the customer who responded to the sales promotion.
  • the rule evaluation unit 102 uses a sample stored in the sample data storage unit 106 for each rule generated by the rule generation unit 101 to determine whether or not an event related to the target occurs. Evaluate.
  • the rule evaluation unit 102 first sets the relationship between the value of the evaluation expression represented by the rule and the result of determination by the rule. Specifically, the rule evaluation unit 102 indicates that the result of determination by the rule when the value of the evaluation expression represented by the rule is true indicates that an event related to the target occurs, or no event related to the target occurs. Set whether to represent. Further, the rule evaluation unit 102 sets the result of determination by the rule when the value of the evaluation expression represented by the rule is false as the result of determination of the rule when the value of the evaluation expression is true. Set to the result of the judgment that did not exist. In the following description, the relationship between the value of the evaluation expression represented by the rule and the result of determination based on the rule is referred to as “determination type”.
  • the rule evaluation unit 102 sets the result of determination based on the rule represented by the evaluation expression so as to indicate that an event related to the object occurs.
  • the rule evaluation unit 102 sets the result of determination based on the rule so as to indicate that an event related to the object does not occur.
  • the relationship between the value of the evaluation formula and the determination result set as described above is expressed as “first determination type”.
  • the target is a customer and the event is that the customer reacts to the promotion
  • the value of the evaluation formula for the sample is true, the customer who obtained the sample responds to the promotion Represents that.
  • the evaluation formula regarding a sample is false, it represents that the customer from whom the sample was obtained does not respond to sales promotion.
  • the rule evaluation unit 102 may set, for example, the result of determination by the rule represented by the evaluation expression when the value of the evaluation expression is false so as to indicate that an event related to the object occurs. In that case, when the value of the evaluation expression is true, the rule evaluation unit 102 may set the result of determination based on the rule so as to indicate that an event related to the object does not occur.
  • the relationship between the value of the evaluation formula and the determination result set as described above is expressed as “second determination type”.
  • the target is a customer and the event is that the customer reacts to the promotion
  • the value of the evaluation formula for the sample is true, the customer from whom the sample was obtained does not respond to the promotion Represents that.
  • the evaluation formula regarding a sample is false, it represents that the customer from whom the sample was obtained reacts to sales promotion.
  • the result of determination by the rule when the evaluation expression represented by the rule is true is set so as to indicate that an event related to the object will occur will be described.
  • the result of determination by the rule when the evaluation expression represented by the rule is true is expressed as “Positive”.
  • the result of determination by the rule is expressed as “Negative”. In that case, positive indicates that an event related to the object occurs. Furthermore, negative (Negative) indicates that no event related to the object occurs.
  • the target is a customer and the event is that the customer reacts to a promotion
  • Positive represents that the customer responds to the promotion.
  • Negative represents that the customer does not respond to the promotion.
  • the rule evaluation unit 102 determines whether the evaluation expression representing the rule is true or false when the value of the explanatory variable is the value of the explanatory variable included in the sample. Then, the rule evaluation unit 102 compares the determination result with the value of the determination result (correct answer) of the sample stored in the sample data storage unit 106. Hereinafter, the value of the determination result (correct answer) is also simply referred to as “correct answer”.
  • the rule evaluation unit 102 determines, for example, a predetermined number of samples, and compares the determination result with the determination result (correct answer). Then, for each rule, the rule evaluation unit 102 calculates, for example, an index value representing the discrimination performance based on the rule shown below based on the comparison result between the determination result and the correct answer.
  • the rule evaluation unit 102 may calculate another index value representing the discrimination performance based on the rule, instead of at least one of the following index values.
  • the rule evaluation unit 102 may calculate other index values representing the discrimination performance based on the rules in addition to the index values
  • F value TP represents the number of samples whose determination result by the rule is Positive among samples whose correct answer is Positive.
  • TP is the number of samples in which an event related to the target is determined to occur as a result of the determination according to the rule among the samples in which the event related to the target has occurred.
  • the FP represents the number of samples whose determination result by the rule is Positive among the samples whose correct answer is Negative.
  • the FP is the number of samples that are determined to have an event related to the target as a result of determination according to the rule among samples in which no event related to the target has occurred.
  • TN represents the number of samples whose determination result by the rule is Negative among the samples whose correct answer is Negative.
  • TN is the number of samples in which no event related to the target has been determined as a result of the determination according to the rule among the samples in which no event related to the target has occurred.
  • FN represents the number of samples whose determination result by the rule is Negative among samples whose correct answer is Positive.
  • FN is the number of samples in which an event related to the target is determined not to occur as a result of the determination according to the rule among the samples where the event related to the target has occurred.
  • Precition is the ratio of samples whose correct answer is Positive among samples whose result of determination by the rule is Positive.
  • Precision represents a ratio of samples in which an event related to the target has occurred among samples determined to generate an event related to the target as a result of determination according to the rule. Precision is also expressed as precision or accuracy. Precision is expressed by the following equation. In the following expression, “/” is a division operator.
  • the rule evaluation unit 102 may further calculate each evaluation index described above when the values of Positive and Negative are interchanged. As described above, when the positive value (Positive) first calculates the index value when the event related to the object occurs, the rule evaluation unit 102, in this case, the positive (Positive) is the event related to the object. An index value is calculated when it indicates that no occurs. This time, negative (Negative) indicates that an event related to the object does not occur.
  • an index value in the case where the values of Positive and Negative are not interchanged will be referred to as an “index value in the first determination result”. That is, the index value calculated in the case of the first determination type described above is referred to as an “index value in the first determination result”. Furthermore, an index value when the values of Positive and Negative are interchanged is referred to as an “index value in the second determination result”. That is, the index value calculated in the case of the second determination type described above is referred to as an “index value in the second determination result”.
  • the rule evaluation unit 102 may set TP in the first determination result to FN in the second determination result.
  • the rule evaluation unit 102 may set the FP in the first determination result to TN in the second determination result.
  • the rule evaluation unit 102 may set TN in the first determination result to FP in the second determination result.
  • the rule evaluation unit 102 may set FN in the first determination result to TP in the second determination result.
  • the rule evaluation unit 102 may calculate the Precision, the Recall, and the F value using the TP, FP, TN, and FN set as described above.
  • the rule evaluation unit 102 assigns a rule identifier to the combination of the rule number and the determination type.
  • the rule identifier may be, for example, a combination of a rule number and a value representing a determination type when the index value is calculated.
  • the value indicating the determination type is, for example, any one of a predetermined value indicating the first determination type and a value indicating the second determination type, which are different from each other.
  • the rule presentation unit 103 presents the rule identifier and the index value calculated for the rule to, for example, the user of the terminal device 30. Specifically, for example, the rule presentation unit 103 transmits a rule identifier and an index value calculated for the rule to the terminal device 30 for each of the generated rules. The terminal device 30 displays information that can distinguish the received rule and an index value calculated for the rule.
  • FIG. 9 is a diagram schematically illustrating an example of index values presented by the rule presenting unit 103.
  • the rule identifier is a character string in which the rule number and the value representing the above-described determination type are connected by “ ⁇ ”.
  • each row represents an index value in the rule of the rule number represented by the rule identifier and the determination type.
  • the value indicating the first determination type described above is 0, and the value indicating the second determination type is 1.
  • the presented index values are TP, FP, TN, FN, Precision, Recall, and F value.
  • a line with a rule identifier “1-0” represents an index value when the rule number is “1” and the determination type is the first determination type.
  • a row with the rule identifier “2-1” represents an index value when the rule number is “2” and the determination type is the second determination type.
  • the user of the terminal device 30 selects at least one rule identifier, for example, via an input unit (not shown) of the terminal device 30.
  • the terminal device 30 transmits the rule identifier selected by the user to the rule presentation unit 103.
  • the rule presentation unit 103 may further present the rule number specified by the received rule identifier and the index value in the determination type to the user of the terminal device 30.
  • the user of the terminal device 30 may select two or more rule identifiers. In that case, the user may input a method for integrating the selected rules. Then, the terminal device 30 transmits the input method for integrating the rules to the rule presentation unit 103.
  • the method for integrating the selected rules may be, for example, a logical expression in which an index expression representing the selected rule is connected by an operator such as AND or OR. A method for integrating the selected rules may be determined in advance.
  • the rule presenting unit 103 transmits the selected rule identifiers to the rule generating unit 101.
  • the rule presentation unit 103 may further transmit, to the rule generation unit 101, a method for integrating rules received from, for example, the terminal device 30.
  • the rule generation unit 101 generates a rule in which the rule selected by the user is integrated (hereinafter referred to as an integrated rule) by integrating the rule selected by the user according to the method for integrating the rules.
  • the rule evaluation unit 102 determines a sample stored in the sample data storage unit 106 using the integration rule.
  • the rule evaluation unit 102 calculates each index value described above from the sample determination result.
  • the rule evaluation unit 102 transmits the calculated index value to the rule presentation unit 103.
  • the rule presentation unit 103 presents the received index value calculated from the determination result based on the integration rule to the user of the terminal device 30.
  • FIG. 10 is a diagram schematically illustrating an example of the index value calculated from the determination result based on the integration rule.
  • the user of the terminal device 30 may select a rule again.
  • the rule generation device 10 may present the index value in the rule selected by the user to the user of the terminal device 30 again.
  • the user of the terminal device 30 may input an instruction to adopt the selected rule.
  • the rule transmission unit 109 transmits the adopted rule to the determination device 40.
  • the determination device 40 determines whether or not an event related to the target occurs according to the received rule.
  • FIGS. 11 and 12 are flowcharts showing an example of the operation of the determination system 1 of the present embodiment.
  • the determination system 1 starts the operations illustrated in FIGS. 11 and 12 in response to an instruction from the user of the terminal device 30.
  • the prediction model storage unit 104 stores the prediction model generated by the learning device 20.
  • the rule generation unit 101 selects a prediction model that has not been selected from the prediction models stored in the prediction model storage unit 104 (step S101).
  • the rule generation unit 101 selects an explanatory variable that has not been selected from the explanatory variables included in the selected prediction model (step S102).
  • the rule generation unit 101 reads the parameter of the selected explanatory variable from the parameter storage unit 105.
  • the parameters include the number of categories and the number of thresholds.
  • the parameter may further include an upper limit and a lower limit.
  • the rule generation unit 101 generates a rule element for the selected explanatory variable as described above using the read parameter (step S104).
  • the determination system 1 When there is an explanatory variable that has not been selected, that is, when the selected prediction model includes an explanatory variable that has not yet been selected (YES in step S105), the determination system 1 performs the operation after step S102. repeat. When there is no explanatory variable that is not selected, that is, when all explanatory variables included in the selected prediction model are selected (NO in step S105), the determination system 1 next performs the operation of step S106. Do.
  • step S106 the rule generation unit 101 generates the above-described rule based on the generated rule element (step S106). If there is a prediction model that has not been selected (YES in step S107), the determination system 1 repeats the operation from step S101. When there is no unselected prediction model (NO in step S107), the rule generating unit 101 next performs the operation of step S108 shown in FIG.
  • step S108 the rule evaluation unit 102 selects one rule from the generated rules.
  • the rule evaluation unit 102 uses the sample stored in the sample data storage unit 106 to make a determination based on the selected rule.
  • the sample data storage unit 106 calculates the index value of the selected rule using the results of the determinations made on a plurality of samples (step S109). If there is a rule that has not yet been selected (YES in step S110), rule evaluation unit 102 repeats the operations in and after step S108.
  • the rule presenting unit 103 When there is no rule that has not yet been selected, that is, when the index values of all the generated rules are calculated (NO in step S110), the rule presenting unit 103 notifies the user of the terminal device 30 of the rule index. A value is presented (step S111).
  • the rule presentation unit 103 may select an index value of a rule to be presented to the user using the index value value. For example, the rule presenting unit 103 does not have to present the index value of the rule when at least one of the Precision, Recall, and F value of the rule is smaller than a predetermined reference.
  • the criterion of the Precision, Recall, and F value of the rule may be expressed by a threshold value that is predetermined for each of the Precision, Recall, and F value, for example.
  • the user of the terminal device 30 selects one or a plurality of rules from the presented rules.
  • the user may enter two or more rules and a method for integrating the rules.
  • the terminal device 30 transmits the rule identifier of the selected rule to the rule presentation unit 103.
  • the terminal device 30 may transmit the rule identifier of the selected rule and a method for integrating those rules to the rule presentation unit 103.
  • the rule presentation unit 103 receives the rule selection by the user, specifically, the rule identifier of the rule selected by the user (step S112).
  • the rule presentation unit 103 may further receive a method for integrating a plurality of selected rules.
  • the rule evaluation unit 102 selects the rule selected by, for example, the received method of integrating a plurality of rules. Are integrated (step S114). Then, the rule evaluation unit 102 calculates an index value of the integrated rule (Step S115). And operation
  • step S111 the user of the terminal device 30 may select a rule again.
  • the user of the terminal device 30 may input an instruction to adopt the selected rule without reselecting the rule.
  • the rule selected by the user is not updated.
  • the rule transmission unit 109 transmits the selected rule to, for example, the determination device 40 (step S116).
  • the embodiment described above has an effect that a rule for determining the occurrence of an event can be generated so that the rule can be selected according to the required performance.
  • the reason is that the rule generation unit 101 generates a plurality of rules, and the rule evaluation unit 102 calculates an index value representing the performance of the generated rules. Therefore, a rule can be selected according to the required performance based on the index value calculated by the rule evaluation unit 102.
  • FIG. 1 is a block diagram showing the configuration of the determination system 1 of the present embodiment.
  • the determination system 1 of the present embodiment is the same as the determination system 1 of the first embodiment except for the following description.
  • the same components as those of the first embodiment of the determination system 1 of the present embodiment are assigned the same reference numerals, and descriptions thereof are omitted.
  • the prediction model is a prediction model based on heterogeneous mixed learning
  • the prediction model is represented by a combination of a conditional expression and a prediction expression (for example, a multiple regression expression).
  • a prediction model based on heterogeneous mixed learning is represented by a tree structure as shown in FIG. 3, for example, the prediction model is represented by a combination of a conditional expression in a node other than a leaf node and a prediction expression in a leaf node.
  • the conditional expression representing the rule generated in the same manner as the conditional expression representing the rule in the first embodiment may include a plurality of conditional expressions that are not necessarily identical for the same explanatory variable.
  • the rule generation unit 101 of the present embodiment may first generate a rule in the same manner as the rule generation unit 101 of the first embodiment. That is, the rule generation unit 101 of the present embodiment may first generate a conditional expression representing a rule, like the rule generation unit 101 of the first embodiment. Then, the rule generation unit 101 determines whether or not the conditional expression representing the generated rule includes a plurality of conditional expressions for the same explanatory variable. When the conditional expression representing the rule includes a plurality of conditional expressions for the same explanatory variable, the rule generating unit 101 identifies an overlapping portion of the value range of the explanatory variable included in the conditional expression.
  • the range of values of the explanatory variables for which the values of the plurality of conditional expressions for the same explanatory variable are all true are specified as the above-described overlapping portions.
  • the rule generation unit 101 changes a plurality of conditional expressions for the same explanatory variable into conditional expressions that are true when the value of the explanatory variable is included in the overlapping portion of the specified range.
  • changing a plurality of conditional expressions for the same explanatory variable to a conditional expression in which the value is true when the value of the explanatory variable is included in the overlapping portion of the specified range Also referred to as “merging rule elements”.
  • the rule generation unit 101 merges rule elements with respect to all explanatory variables having a plurality of conditional expressions.
  • the rule generation unit 101 first determines whether the explanatory variable of the rule element generated based on the prediction expression (for example, multiple regression expression) in the leaf node has the same explanatory variable as the explanatory variable of the conditional expression in the node other than the leaf node. You may specify whether or not.
  • the rule generation unit 101 explains as described above. Identify overlapping parts of variable value ranges. Then, the rule generation unit 101 generates a conditional expression that makes the value true when the value of the explanatory variable is included in the overlapped portion of the specified range.
  • the rule generation unit 101 replaces the conditional expression of the explanatory variable based on the prediction expression at the leaf node and the conditional expression of the explanatory variable at a node other than the leaf node with the generated conditional expression. Then, the rule generation unit 101 uses the conditional expression based on the prediction expression in the leaf node, the conditional expression in the node other than the leaf node, and the generated conditional expression, excluding the conditional expression replaced with the generated conditional expression. Generate a conditional expression that represents the rule.
  • the rule generation unit 101 simultaneously includes a conditional expression based on a conditional expression in a node other than a leaf node and a rule expression based on a prediction expression in a leaf node for the same explanatory variable in which there is no overlapping part of the value range of the explanatory variable. It is not necessary to generate the rule represented by.
  • step S201 and step S202 are performed.
  • the operation of the determination system 1 of the present embodiment in other steps is the same as the operation of the determination system 1 of the first embodiment in the steps to which the same reference numerals are given. Therefore, those descriptions are omitted.
  • step S201 the rule generation unit 101 determines whether a rule including a plurality of conditional expressions related to the same explanatory variable exists in the generated rule. If there is no rule including a plurality of conditional expressions related to the same explanatory variable in the generated rule (NO in step S201), the determination system 1 of the present embodiment next performs the operation of step S107. If there is a rule including a plurality of conditional expressions related to the same explanatory variable in the generated rule (YES in step S201), the determination system 1 of the present embodiment next performs the operation of step S202.
  • step S202 the rule generation unit 101 merges the above-described rule elements for a rule including a plurality of conditional expressions related to the same explanatory variable.
  • the present embodiment described above has the same effect as the first embodiment.
  • the reason is the same as the reason for the effect of the first embodiment.
  • This embodiment further has an effect of shortening the processing time.
  • the rule generation unit 101 merges rule elements.
  • a conditional expression representing a rule when a plurality of conditional expressions related to the same explanatory variable can be expressed by a single conditional expression related to an overlapping portion of a range of values, the number of conditional expressions is reduced. In this case, the processing time can be shortened because the number of determinations regarding conditional expressions related to the same explanatory variable is reduced when calculating the index.
  • FIG. 1 is a block diagram showing the configuration of the determination system 1 of the present embodiment.
  • the determination system 1 of the present embodiment is the same as the determination system 1 of the first embodiment except for the following description.
  • the same components as those of the first embodiment of the determination system 1 of the present embodiment are assigned the same reference numerals, and descriptions thereof are omitted.
  • the rule generation unit 101 of the present embodiment newly generates a rule element that is true when at least one of the rule elements is true by combining two or more rule elements for the same explanatory variable. To do.
  • combining rule elements to generate a rule element that is true when at least one of those rule elements is true is referred to as “synthesize rule elements”.
  • the rule generation unit 101 may synthesize rule elements by combining a predetermined number of rule elements.
  • the rule generation unit 101 may combine the rule elements by combining the number of rule elements included in the predetermined range.
  • the rule generation unit 101 may synthesize rule elements for all combinations of rule elements generated based on a range of values obtained by dividing the range of the same explanatory variable.
  • the rule generation unit 101 selects at most one rule element from a rule element based on a range of values obtained by dividing the explanatory variable into regions and a synthesized rule element, and selects the selected rule element. Generate rules by combining them.
  • the determination system 1 of the present embodiment performs the operation of step S301 between the operation of step S104 and the operation of step S105.
  • step S301 the rule generation unit 101 synthesizes the rule elements as described above.
  • step S106 the rule generation unit 101 also generates a rule using the combined rule element.
  • the determination system 1 of the present embodiment performs the same operation as the determination system 1 of the first embodiment except for the above.
  • the present embodiment described above has the same effect as the first embodiment.
  • the reason is the same as the reason for the effect of the first embodiment.
  • This embodiment has an effect of further improving the performance of the rule.
  • the reason is that the rule generation unit 101 merges rule elements.
  • the rule performance may be higher than when other rule elements are selected. In that case, the performance of the generated rule is improved.
  • the determination system 1 of the present embodiment may further perform the same operation as the determination system 1 of the second embodiment.
  • 15 and 12 are flowcharts showing an example of the operation of the determination system 1 of this embodiment in that case.
  • step S ⁇ b> 201 the operation in step S ⁇ b> 202 between the operation in step S ⁇ b> 106 and the operation in step S ⁇ b> 107. I do.
  • the operation in step S201 and the operation in step S202 are the same as the operation of the rule generation unit 101 of the second embodiment to which the same reference numerals are given.
  • This embodiment in this case further has the same effect as the second embodiment.
  • the reason is the same as the reason for the effect of the second embodiment.
  • FIG. 16 is a block diagram illustrating an example of the configuration of the rule generation device 10A of the present embodiment.
  • the rule generation device 10 ⁇ / b> A of the present embodiment includes a rule generation unit 101 and a rule evaluation unit 102.
  • the rule generation unit 101 generates a rule for determining whether or not an event occurs based on a combination of ranges of values of one or more explanatory variables that describe the event.
  • the rule evaluation unit 102 calculates an index value representing the performance of the rule based on the result of determining whether the sample matches the generated rule with respect to the set of samples.
  • the sample is data in which a value indicating whether an event occurs and an explanatory variable value are associated with each other.
  • FIG. 20 is a flowchart showing an example of the operation of the rule generation device 10A of this embodiment.
  • the rule generation unit 101 generates a rule for determining whether or not the event occurs based on a combination of ranges of values of one or more explanatory variables that explain the event (Ste S401).
  • the rule evaluation unit 102 calculates an index value representing the performance of the rule based on the result of determining whether the sample matches the generated rule with respect to the set of samples (step S402).
  • the present embodiment described above has the same effect as the first embodiment.
  • the reason is the same as the reason for the effect of the first embodiment.
  • Each of the rule generation devices 10 and 10A according to the above-described embodiments can be realized by a circuit configuration.
  • the circuit configuration is, for example, a computer including one or more memories and one or more processors that execute programs loaded in the memories.
  • the circuit configuration may be two or more computers communicatively connected.
  • the circuit configuration is, for example, dedicated hardware such as a circuit.
  • the circuit configuration may be two or more circuits that are communicably connected.
  • the circuit configuration may be a combination of the above computer and the above circuit.
  • FIG. 17 is a diagram illustrating an example of a hardware configuration of the computer 1000 that can realize the rule generation devices 10 and 10A.
  • a computer 1000 includes a processor 1001, a memory 1002, a storage device 1003, and an I / O (Input / Output) interface 1004.
  • the computer 1000 can access the recording medium 1005.
  • the memory 1002 and the storage device 1003 are storage devices such as a RAM (Random Access Memory) and a hard disk, for example.
  • the recording medium 1005 is, for example, a storage device such as a RAM or a hard disk, a ROM (Read Only Memory), or a portable recording medium.
  • the storage device 1003 may be the recording medium 1005.
  • the processor 1001 can read and write data and programs from and to the memory 1002 and the storage device 1003.
  • the processor 1001 can access, for example, the learning device 20, the terminal device 30, and the determination device 40 via the I / O interface 1004.
  • the processor 1001 can access the recording medium 1005.
  • the recording medium 1005 stores a program that causes the computer 1000 to operate as the rule generation device 10 or the rule generation device 10A.
  • the processor 1001 loads a program stored in the recording medium 1005 that causes the computer 1000 to operate as the rule generation device 10 or the rule generation device 10A into the memory 1002. Then, when the processor 1001 executes the program loaded in the memory 1002, the computer 1000 operates as the rule generation device 10 or the rule generation device 10A.
  • the units included in the following first group include, for example, a dedicated program that can be read from a recording medium 1005 that stores the program into the memory 1002 and that can realize the function of each unit, and a processor 1001 that executes the program. Can be realized.
  • the first group includes a rule generation unit 101, a rule evaluation unit 102, a rule presentation unit 103, a prediction model transmission / reception unit 107, a parameter reception unit 108, and a rule transmission unit 109.
  • the units included in the following second group can be realized by the memory 1002 included in the computer 1000 and the storage device 1003 such as a hard disk device.
  • the units included in the second group are a prediction model storage unit 104, a parameter storage unit 105, and a sample data storage unit 106.
  • part or all of the units included in the first group and the units included in the second group can be realized by a dedicated circuit that realizes the function of each unit.
  • FIG. 18 is a block diagram illustrating an example of the configuration of the rule generation device 10 according to the first, second, and third embodiments of the present invention implemented by a circuit.
  • FIG. 19 is a block diagram illustrating an example of the configuration of a rule generation device 10A according to the fourth exemplary embodiment of the present invention that is implemented by a circuit.
  • the rule generation circuit 1101 operates as the rule generation unit 101. That is, the rule generation unit 101 is realized by the rule generation circuit 1101.
  • the rule evaluation circuit 1102 operates as the rule evaluation unit 102. That is, the rule evaluation unit 102 is realized by the rule evaluation circuit 1102.
  • the rule presentation circuit 1103 operates as the rule presentation unit 103. That is, the rule presentation unit 103 is realized by the rule presentation circuit 1103.
  • the prediction model transmission / reception circuit 1107 operates as the prediction model transmission / reception unit 107. That is, the prediction model transmission / reception unit 107 is realized by the prediction model transmission / reception circuit 1107.
  • the parameter receiving circuit 1108 operates as the parameter receiving unit 108. That is, the parameter receiving unit 108 is realized by the parameter receiving circuit 1108.
  • the rule transmission circuit 1109 operates as the rule transmission unit 109. That is, it is realized by the rule transmission unit 109.
  • the prediction model storage device 1104 operates as the prediction model storage unit 104. That is, the prediction model storage unit 104 is realized by the prediction model storage device 1104.
  • the parameter storage device 1105 operates as the parameter storage unit 105. That is, the parameter storage unit 105 is realized by the parameter storage device 1105.
  • the sample data storage device 1106 operates as the sample data storage unit 106. That is, the sample data storage unit 106 is realized by the sample data storage device 1106.
  • Each of the prediction model storage device 1104, the parameter storage device 1105, and the sample data storage device 1106 may be a storage circuit.
  • Each of the prediction model storage device 1104, the parameter storage device 1105, and the sample data storage device 1106 may be a storage device.
  • Rule generating means for generating a rule for determining whether or not the event occurs based on a combination of ranges of values of one or more explanatory variables that describe the event; Based on the determination result of the set of samples, whether or not the sample in which the value indicating whether the event occurs and the value associated with the explanatory variable match the generated rule is appropriate.
  • Rule evaluation means for calculating an index value representing the performance of the rule,
  • a rule generation device comprising:
  • the explanatory variable is the explanatory variable included in the prediction model representing the relationship between the objective variable related to the event and the explanatory variable explaining the objective variable,
  • the rule generation device according to claim 1, wherein the rule generation unit generates the rule based on a combination of ranges of values of the explanatory variables included in the same prediction model.
  • the prediction model further includes a condition regarding the value of the explanatory variable
  • the rule generation device according to claim 2, wherein the rule generation unit generates the rule based further on a condition relating to a value of the explanatory variable.
  • the rule generation means further generates a new range for the explanatory variable by combining a plurality of non-identical ranges for the same explanatory variable. Rule generator.
  • Appendix 7 A rule presentation unit that presents the index value for each rule for which the index value has been calculated, and obtains a rule identifier of the rule selected in the rule for which the index value has been presented;
  • the rule generation unit according to any one of appendices 1 to 6, wherein, when two or more of the rules are selected, the rule generation unit generates an integrated rule in which the two or more selected rules are integrated. apparatus.
  • the prediction model further includes: The rule generation method according to claim 9, wherein the rule is further generated based on a condition relating to a value of the explanatory variable.
  • Appendix 11 The rule generation method according to any one of appendices 8 to 10, wherein the range is set by dividing a range of the explanatory variable according to a predetermined rule.
  • a rule generation process for generating a rule for determining whether or not the event occurs based on a combination of ranges of values of one or more explanatory variables describing the event; Based on the determination result of the set of samples, whether or not the sample in which the value indicating whether the event occurs and the value associated with the explanatory variable match the generated rule is appropriate.
  • a rule evaluation process for calculating an index value representing the performance of the rule; Rule generation program that executes
  • the explanatory variable is the explanatory variable included in the prediction model representing the relationship between the objective variable related to the event and the explanatory variable explaining the objective variable,
  • the rule generation processing generates the rule based on a combination of ranges of values of the explanatory variables included in the same prediction model.
  • the rule generation program according to attachment 15.
  • the prediction model further includes a condition regarding the value of the explanatory variable
  • the rule generation process generates the rule further based on a condition regarding the value of the explanatory variable.
  • the rule generation program according to attachment 16.
  • the rule generation process further generates a new range for the explanatory variable by combining a plurality of non-identical ranges for the same explanatory variable. Rule generator.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

 必要な性能に応じてルールを選択できるように、事象の発生を判定するルールを生成することができるルール生成装置を提供する。 本発明の一態様に係るルール生成装置は、事象を説明する1つ以上の前記説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成するルール生成手段と、生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出するルール評価手段と、を備える。

Description

ルール生成装置、ルール生成方法及びルール生成プログラムを記憶する記録媒体
 本発明は、ルールを生成する技術に関し、特に、判定に使用するルールを生成する技術に関する。
 ルールを生成する技術の例が、例えば特許文献1によって開示されている。
 特許文献1には、ルールを用いて異常兆候の有無を推論する異常兆候検出システムが記載されている。特許文献1におけるルールは、属性値の組み合わせに関連付けられる結論部によって表される。特許文献1の異常兆候検出システムは、事例データを使用して、ルールを生成する。
特開平10-187452号公報
 特許文献1の異常兆候検出システムが生成するルールは1種類である。従って、特許文献1の技術では、性能によってルールを選択することはできない。
 本発明の目的の1つは、必要な性能に応じてルールを選択できるように、事象の発生を判定するルールを生成することができるルール生成装置を提供することにある。
 本発明の一態様に係るルール生成装置は、事象を説明する1つ以上の前記説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成するルール生成手段と、生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出するルール評価手段と、を備える。
 本発明の一態様に係るルール生成方法は、事象を説明する1つ以上の前記説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成し、生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出する。
 本発明の一態様に係るルール生成プログラムは、コンピュータを、事象を説明する1つ以上の前記説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成するルール生成手段と、生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出するルール評価手段と、して動作させる。
 本発明には、必要な性能に応じてルールを選択できるように、事象の発生を判定するルールを生成することができるという効果がある。
図1は、本発明の第1、第2、第3の実施形態の判定システムの構成の例を表すブロック図である。 図2は、本発明の第1の実施形態の予測モデル記憶部が記憶する、予測モデルの例を模式的に表す図である。 図3は、異種混合学習に基づく予測モデルを模式的に表す図である。 図4は、本発明の第1の実施形態の予測モデル記憶部が記憶する、異種混合学習に基づく木構造によって表される予測モデルを模式的に表す図である。 図5は、本発明の第1の実施形態の予測モデル記憶部が記憶する、異種混合学習に基づく木構造によって表される予測モデルを模式的に表す図である。 図6は、本発明の第1の実施形態のパラメータ記憶部が記憶するパラメータの例を模式的に表す図である。 図7は、本発明の第1の実施形態のパラメータ記憶部が記憶するパラメータの他の例を模式的に表す図である。 図8は、本発明の第1の実施形態のサンプルデータ記憶部が記憶するサンプルの例を模式的に表す図である。 図9は、本発明の第1の実施形態のルール提示部が提示する指標値の例を模式的に表す図である。 図10は、統合ルールによる判定結果から算出された指標値の例を模式的に表す図である。 図11は、本発明の第1の実施形態の判定システムの動作の例を表すフローチャートである。 図12は、本発明の第1、第2、第3の実施形態の判定システムの動作の例を表すフローチャートである。 図13は、本発明の第2の実施形態の判定システムの動作の例を表すフローチャートである。 図14は、本発明の第3の実施形態の判定システムの動作の例を表すフローチャートである。 図15は、本発明の第3の実施形態の判定システムの動作の他の例を表すフローチャートである。 図16は、本発明の第4の実施形態のルール生成システムの構成の例を表すブロック図である。 図17は、本発明の各実施形態に係るルール生成装置を実現することができるコンピュータの、ハードウェア構成の一例を表す図である。 図18は、回路によって実装された、本発明の第1、第2、及び第3の実施形態の判定システムの構成の例を表すブロック図である。 図19は、回路によって実装された、本発明の第4の実施形態のルール生成システムの構成の例を表すブロック図である。 図20は、本発明の第4の実施形態のルール生成システムの動作の例を表すフローチャートである。
 次に、本発明の実施形態について図面を参照して詳細に説明する。
 <第1の実施形態>
 まず、本発明の第1の実施形態について図面を参照して詳細に説明する。
 図1は、本実施形態の判定システム1の構成の例を表すブロック図である。
 図1を参照すると、本実施形態の判定システム1は、ルール生成装置10と、学習装置20と、端末装置30と、判定装置40とを含む。ルール生成装置10は、学習装置20、端末装置30、及び判定装置40のそれぞれと、通信可能に接続されている。なお、図1及び他の図において、データ等が送信される方向は、図に示されている矢印の方向に限定されない。
 ルール生成装置10は、ルール生成部101と、ルール評価部102と、ルール提示部103と、予測モデル記憶部104と、パラメータ記憶部105と、サンプルデータ記憶部106と、予測モデル送受信部107と、パラメータ受信部108と、ルール送信部109とを含む。
 予測モデル記憶部104は、予測モデルを記憶する。予測モデル記憶部104が記憶する予測モデルは、例えば、目的変数と、その目的変数を説明する説明変数との関係によって表される。本実施形態の予測モデル記憶部104に格納されている予測モデルでは、目的変数は、例えば、所定の対象に関する事象が発生する可能性の程度等の、対象の事象に関する変数を表す。説明変数は、例えば、対象又は環境などにおける、例えば、状況、性質、属性、又は、測定結果などの、対象に関する事象に影響がある変数を表す。本実施形態では、説明変数の値は、数値によって表される。説明変数の値が、例えば説明変数が天気である場合における説明変数の値である「晴れ」や「雨」のように、数値ではない値である場合、例えば判定システム1の設計者によって、それらの数値ではない値にあらかじめ数値が割り当られていればよい。
 対象は、例えば、顧客である。事象は、例えば、顧客が販促に反応することである。販促は、例えば、ダイレクトメール(例えば郵便物又は電子メール)、又は、インターネット広告などによる報知である。販促への反応は、例えば、商品の購入、来店、イベントなどへの参加、広告サイトへのアクセスなどである。この場合、説明変数は、例えば、それぞれの顧客の、過去の反応回数、過去の反応において使用した金額、最後の反応からの経過日数、住所、年齢、性別、及び、休日情報等である。
 対象は、例えば、商品需要予測、電力需要予測、又は来店数予測などの対象である日であってもよい。そして、事象は、例えば、行われた商品需要予測、電力需要予測、又は来店数予測などが大きく外れることであってもよい。この場合、説明変数は、過去の実績値、気象(例えば、天気、気温、降水量など)、休日情報、イベント開催日の情報、キャンペーン開催日の情報などである。過去の実績値は、例えば、過去の所定期間内における毎日の、商品需要の値、電力需要の値、又は、来店数の値などである。
 対象は、例えば、電子メールであってもよい。そして、事象は、電子メールが迷惑メール(例えばジャンクメール)であることである。この場合、説明変数は、特定の単語の有無、特定の単語の登場回数、特定の単語の組の共起の有無、特定の単語の共起回数等である。
 対象は、例えば、契約しているユーザであってもよい。そして、事象は、例えば、ユーザが所定期間内に解約することであってもよい。この場合、説明変数は、住所、性別、年齢、契約期間、過去の所定期間におけるサービスの利用頻度などである。
 対象は、例えば、使用されると劣化する部品であってもよい。対象は、例えば、使用されると摩耗するタイヤであってもよい。事象は、部品が所定期間内に所定の基準より摩耗することである。この場合、説明変数は、部品使用回数、部品使用期間、部品への負荷などである。
 対象は、例えば、故障する可能性がある部品であってもよい。事象は例えば、部品が所定期間内に故障することであってもよい。この場合、説明変数は、部品使用回数、部品使用期間、部品への負荷などである。
 以下では、具体例について説明する場合、主に、対象が顧客であり、事象が、顧客が販促に反応することである場合における例について説明する。
 上述のように、予測モデル記憶部104が記憶する予測モデルは、例えば、事象に関する変数である目的変数と、目的変数を説明する変数である説明変数との間の関係を表す。予測モデルが、例えば、重回帰分析に基づく予測モデルである場合、予測モデルは、説明変数の一次多項式(すなわち重回帰式)によって表される。すなわち、予測モデルは、説明変数の識別子(以下説明変数ID(Idetification)と表記)とその説明変数の係数の大きさとの、複数の組み合わせによって表される。
 図2は、予測モデル記憶部104が記憶する、予測モデルの例を模式的に表す図である。図2に示す予測モデルの例は、重回帰分析に基づく予測モデルである。図2に示す例では、説明変数IDは「説明変数名」である。図2に示す例では、説明変数は、販促に反応した回数である「回数」、過去の販促への反応において使用した金額である「金額」、及び、最後の反応から経過した日数である「経過日数」等である。
 予測モデルが、異種混合学習に基づく予測モデルである場合、予測モデルは、葉ノードに重回帰式が割り当てられ、葉ノード以外のノードに説明変数の条件式が割り当てられている木構造によって表される。すなわち、異種混合学習に基づく予測モデルは、根ノードから葉ノードまでの経路に含まれるノードに割り当てられている、説明変数の条件式と重回帰式との組によって表される。本実施形態の説明では、根ノードから葉ノードまでの1つの経路が、1つの予測モデルを表す。
 図3は、異種混合学習に基づく予測モデルを模式的に表す図である。図3において、条件1及び条件2は、それぞれ、いずれかの説明変数に関する条件式である。予測式1、予測式2、及び予測式3は、説明変数の一次多項式(すなわち、上述のように、重回帰式)である。以下の説明では、予測モデルの少なくとも一部を表す重回帰式を、「予測式」とも表記する。例えば、条件1がFalseであり、条件2がTrueである場合における予測モデルは、「条件1がFalse」、「条件2がTrue」、及び、「予測式1」によって表される。条件1がFalseであり、条件2がFalseである場合における予測モデルは、「条件1がFalse」、「条件2がFalse」、及び、「予測式2」によって表される。条件1がTrueである場合における予測モデルは、「条件1がTrue」、及び、「予測式3」によって表される。図3に示す木構造は、3つの予測モデルを表す。
 図4及び図5は、予測モデル記憶部104が記憶する、異種混合学習に基づく木構造によって表される予測モデルを模式的に表す図である。
 図4は、木構造と、葉ノード以外のノードにおける条件式を表す。図4において「ノード番号」は、ノード番号である。「葉ノード」は、ノード番号によって特定されるノードが、葉ノードであるか否かを表す。図4に示す例では、「葉ノード」の値が1であるノードは、葉ノードである。「葉ノード」の値が0であるノードは、葉ノードではない。また、「説明変数」及び「閾値」が、条件式を表す。「説明変数」は、説明変数ID(図4に示す例では説明変数名)をである。「閾値」は、説明変数の値についての閾値である。例えば、ノード番号が1であるノード(図3におけるノード1)における条件式(図3における条件1)は、説明変数「回数」が、閾値「5」より小さいことを表す式である。ノード番号が2であるノード(図3におけるノード2)における条件式(図3における条件2)は、説明変数「金額」が閾値「10000(円)」より小さいことを表す式である。
 図4に例示する「説明変数」及び「閾値」は、「説明変数」の値が「閾値」の値より小さい場合、値がTrueである条件式を表す。「次ノード番号(閾値より小)」は、説明変数の値が閾値より小さい場合(すなわち条件式がTrueである場合)における、次のノードの番号である。「次ノード番号(閾値以上)」は、説明変数の値が閾値より小さくない場合(すなわち条件式がFalseである場合)における、次のノードの番号である。木構造は、葉ノード以外のノードの「次ノード番号(閾値より小)」及び「次ノード番号(閾値以上)」によって表される。
 図5は、葉ノードにおける予測式を表す。「ノード番号」は葉ノードのノード番号である。「説明変数名」は、図5に示す例では説明変数の名称である、説明変数IDである。「係数」は、予測式における説明変数の係数の値である。図5に示す例では、ノード番号と、説明変数名と、係数とが関連付けられている。同じノード番号に関連付けられている、説明変数名と係数とが、そのノード番号によって特定される葉ノードにおける予測式を表す。
 予測モデル記憶部104は、予測モデル全体を記憶するのではなく、予測モデル毎に、予測モデルに含まれる説明変数の説明変数IDを記憶していてもよい。以下の説明において、説明変数IDを記憶することを、説明変数を記憶するとも表記する。
 予測モデル送受信部107は、学習装置20から予測モデルを受信する。予測モデル送受信部107は、受信した予測モデルを、予測モデル記憶部104に格納する。予測モデル送受信部107は、さらに、予測モデル記憶部104に格納されている予測モデルを、端末装置30に送信してもよい。
 端末装置30は、予測モデルを受信し、受信した予測モデルを表示してもよい。そして、例えば端末装置30を操作するルール生成装置10のユーザが、予測モデルに含まれる説明変数毎に、後述される「カテゴリ数」及び「閾値数」を設定してもよい。その場合、端末装置30は、設定された「カテゴリ数」及び「閾値数」を、ルール生成装置10のパラメータ受信部108に送信する。
 パラメータ受信部108は、端末装置30から「カテゴリ数」及び「閾値数」を受信する。パラメータ受信部108は、受信した「カテゴリ数」及び「閾値数」をパラメータ記憶部105に格納する。
 パラメータ記憶部105は、ルールの生成に関するパラメータを記憶する。具体的には、パラメータ記憶部105は、予測モデル記憶部104に格納されている予測モデルに含まれる説明変数の各々について、値域の分割に使用されるパラメータを記憶する。値域は、例えば、3つ以上の範囲に分割される。以下では、値域が3つ以上の範囲に分割される場合における範囲の数を、「カテゴリ数」と表記する。値域は、例えば、閾値によって2つの領域に分割される。値域は、異なる複数の閾値のそれぞれによって、2つの領域に分割されてもよい。以下では、値域を2つの領域に分割する閾値の数を「閾値数」と表記する。パラメータ記憶部105は、説明変数の各々についてのパラメータとして、カテゴリ数及び閾値数を記憶していてもよい。
 パラメータ記憶部105は、予測モデル記憶部104に格納されている予測モデルに含まれる説明変数の各々について、上限値及び下限値を記憶していてもよい。上限値及び下限値は、例えば、値域を3つ以上の範囲に分割する場合における、範囲の境界の上限値及び下限値であってもよい。上限値及び下限値は、複数の閾値の各々によって値域を2つの領域に場合における、閾値の上限値及び下限値であってもよい。パラメータ記憶部105は、説明変数の各々についてのパラメータとして、上限値及び下限値を含んでいてもよい。
 図6は、パラメータ記憶部105が記憶するパラメータの例を模式的に表す図である。図6に示すパラメータは、説明変数毎のカテゴリ数と閾値数とを含む。
 図7は、パラメータ記憶部105が記憶するパラメータの他の例を模式的に表す図である。図7に示すパラメータは、説明変数毎の、カテゴリ数と、閾値数と、上限と、下限とを含む。図7の上限は、説明変数の値域が領域の境界を表す値の上限であり、説明変数の値域を2つの範囲に分割する閾値の上限である。同様に、図7の下限は、説明変数の値域が領域の境界を表す値の下限であり、説明変数の値域を2つの範囲に分割する閾値の下限である。図7に示す例では、説明変数の値域が領域の境界を表す値の上限は、説明変数の値域を2つの範囲に分割する閾値の上限と同じである。しかし、説明変数の値域が領域の境界を表す値の上限は、説明変数の値域を2つの範囲に分割する閾値の上限と異なっていてもよい。また、説明変数の値域が領域の境界を表す値の下限は、説明変数の値域を2つの範囲に分割する閾値の下限と同じである。しかし、説明変数の値域が領域の境界を表す値の下限は、説明変数の値域を2つの範囲に分割する閾値の下限と異なっていてもよい。
 ルール生成部101は、パラメータ記憶部105に格納されているパラメータをもとに、予測モデル記憶部104に格納されている説明変数の値域を複数の値の範囲(以下、単に「範囲」とも表記)に分割する。そして、ルール生成部101は、説明変数の値域を分割することによって得られる範囲をもとに、その説明変数に関するルール要素を生成する。
 説明変数に関するルール要素は、例えば、その説明変数の値に関する条件式で表され、その条件式が満たされれば真であり、その条件式が満たされなければ偽である。値の範囲に基づく説明変数に関するルール要素は、例えば、その説明変数の値がその値の範囲に含まれる場合に真であり、それ以外の場合に偽である条件式である。ルール生成部101は、説明変数の値域を分割することによって得られる範囲の各々について、ルール要素を生成する。以下、値域の分割とルール要素の生成について、さらに詳しく説明する。
 説明変数のカテゴリ数として、3以上の値(以下Cと表記)が設定されている場合、ルール生成部101は、その説明変数の値域をC個の領域に分割する。以下の説明では、説明変数の値域をカテゴリ数と同じ個数の範囲に分割することを、カテゴリ数に基づく分割とも表記する。ルール生成部101は、例えば、上述の上限と下限とを範囲の境界に設定し、さらに、設定した境界によって区切られた範囲の数がC個になるように、上限と下限との間に等間隔で範囲の境界を設定すればよい。ルール生成部101は、設定された境界によって地域を分割することにより、C個の範囲を生成する。ルール生成部101は、生成した範囲のそれぞれについて、説明変数がその範囲に含まれるというルール要素を生成する。
 例えば説明変数の1つである説明変数Aのカテゴリ数が3である場合、ルール生成部101は、説明変数Aの値域を、3つの範囲に分割する。例えば、上述の上限と下限との間に、範囲が3つになるように、1つの、範囲の境界を設定する。例えば、説明変数Aが説明変数「回数」であり、上限が10であり、下限が2である場合、ルール生成部101は、上限である10と下限である2とを、範囲の境界に設定する。その場合、説明変数「回数」の値域は、2回未満、2回以上10回未満、及び、10回以上の3つの範囲に区切られる。すなわち、3つの範囲が生成される。この場合、ルール生成部101は、カテゴリ数である3と同数の範囲が設定されているため、上限と下限との間に範囲の境界を設定しない。そして、ルール生成部101は、説明変数「回数」に関するルールとして、「回数が2回未満である」、「回数が2回以上10回未満である」、及び、「回数が10回以上である」の2つのルール要素を生成する。
 説明変数のカテゴリ数が1である場合、そのカテゴリ数は、説明変数の値域が分割されないことを表す。その場合、ルール生成部101は、その説明変数について、カテゴリ数に基づくルール要素を生成しなくてよい。説明変数のカテゴリ数が2である場合、そのカテゴリ数は、説明変数の値域が1個の値によって分割されることを表す。その場合、上限と下限とが同じ値であれば、ルール生成部101は、同一の値である上限及び下限を、範囲の境界に設定してもよい。上限と下限が異なる場合、ルール生成部101は、例えば上限と下限との平均を、範囲の境界に設定してもよい。
 以上の説明では、ルール生成部101は、範囲の境界を等間隔に設定する。しかし、ルール生成部101は、説明変数の値の対数について範囲の境界が等間隔であるように、範囲の境界を設定してもよい。ルール生成部101は、あらかじめ決められている、範囲の境界を設定する他の方法に従って、範囲の境界を設定してもよい。
 説明変数の閾値数として2以上の値(以下、Tと表記)が設定されている場合、ルール生成部101は、異なるT個の閾値を設定する。上限と下限とが異なる場合、ルール生成部101は、上限及び下限をそれぞれ閾値に設定する。さらに、ルール生成部101は、閾値の数がT個になるように、上限と下限との間に、例えば等間隔で閾値を設定する。そして、ルール生成部101は、異なるT個の閾値の各々について、その閾値を使用して、その説明変数の値域を2つの範囲に分割する。そして、ルール生成部101は、異なるT個の閾値の各々について、説明変数の値域が2つに分割することによって生成された2つの範囲のうち、あらかじめ定められた少なくともいずれか一方の範囲をもとに、ルール要素を生成する。ルール生成部101は、例えば、閾値以上の範囲をもとに、説明変数に関するルール要素として、「その説明変数の値が閾値以上である」というルール要素を生成してもよい。ルール生成部101は、例えば、閾値未満の範囲をもとに、説明変数に関するルール要素として、「その説明変数の値が閾値未満である」というルール要素を生成してもよい。ルール生成部101は、例えば、閾値以上の範囲をもとに「説明変数の値が閾値以上である」というルール要素を生成し、加えて、閾値未満の範囲をもとに「その説明変数の値が閾値未満である」というルール要素を生成してもよい。以下、閾値以上の範囲をもとに生成されたルール要素のグループを「第1要素グループ」と表記する。以下、閾値未満の範囲をもとに生成されたルール要素のグループを「第2要素グループ」と表記する。
 例えば、説明変数「回数」の閾値数が3である場合、ルール生成部101は、3つの閾値を設定する。上限と下限とが異なる場合、ルール生成部101は、上限及び下限をそれぞれ閾値に設定する。ルール生成部101は、さらに、閾値の数が3になるように、上限と下限との間に等間隔で閾値を設定する。上限が10回であり、下限が2回である場合、ルール生成部101は、上限である10回と、下限である2回を閾値に設定する。さらにルール生成部101は、閾値の数が3つであるように、上限と下限との間に、例えば等間隔で閾値を設定する。その場合、ルール生成部101は、閾値として6回を設定する。
 ルール生成部101は、生成した閾値の各々をもとに、ルール要素を設定する。閾値が2回、6回、及び10回である場合、ルール生成部101は、説明変数「回数」について、例えば、「回数が2回以上である」、「回数が6回以上である」、及び「回数が10回以上である」というルール要素を生成する。この場合、上述の第1要素グループは、「回数が2回以上である」、「回数が6回以上である」、及び「回数が10回以上である」というルール要素のグループである。
 ルール生成部101は、説明変数「回数」について、例えば、「回数が2回未満である」、「回数が6回未満である」、及び「回数が10回未満である」というルール要素を生成してもよい。この場合、上述の第2要素グループは、「回数が2回未満である」、「回数が6回未満である」、及び「回数が10回未満である」というルール要素のグループである。ルール生成部101は、第1要素グループのルール要素に加えて第2要素グループのルール要素を生成してもよい。
 以上の説明では、ルール生成部101は、上限と下限との間で閾値が等間隔になるように、閾値を設定する。しかし、ルール生成部101は、閾値の対数について閾値が等間隔であるように、閾値を設定してもよい。ルール生成部101は、あらかじめ決められている、閾値を設定する他の方法に従って、閾値を設定してもよい。
 さらに、ルール生成部101は、予測モデルに含まれるそれぞれの説明変数について多くて1つの生成したルール要素を含む、ルール要素の組み合わせの各々に基づいて、ルールを生成する。
 予測モデルが重回帰分析に基づく予測モデルである場合、上述のように、その予測モデルは重回帰式によって表される。予測モデルが重回帰式によって表される場合、ルール生成部101は、その重回帰式に含まれるそれぞれの説明変数について多くて1つの生成したルール要素を含む、ルール要素の組み合わせ毎に、ルールを生成する。
 例えば、重回帰式に説明変数Aが含まれ、説明変数Aについてのルール要素の数が3である場合、生成されるルールに3つのルール要素のうちいずれかが含まれるか、生成されるルールには3つのルール要素はいずれも含まれない。よって、説明変数Aについてのルール要素の数が3である場合、説明変数Aに関して(3+1)通りのルールが生成される。例えば、重回帰式に説明変数Bが含まれ、説明変数Bについてのルール要素の数が2である場合、生成されるルールに2つのルール要素のうちいずれかが含まれるか、生成されるルールには2つのルール要素はいずれも含まれない。よって、説明変数Aについてのルール要素の数が2である場合、説明変数Aに関して(2+1)通りのルールが生成される。
さらに、例えば、重回帰式に説明変数A及び説明変数Bが含まれ、説明変数Aについて生成したルール要素の数は3であり、説明変数Bについて生成したルール要素の数が2である場合、上述のルール要素の組み合わせの数は、(3+1)×(2+1)=12である。この場合、ルール生成部101は、12個のルールを生成する。
 重回帰分析に基づく予測モデルについてのルールは、上述のルール要素の組み合わせに含まれる、全てのルール要素についての判定が真である場合に真であり、それ以外の場合に偽である条件式によって表される。上述のように、ルール要素は条件式である。重回帰分析に基づく予測モデルについてのルールは、例えば、上述のルール要素の組み合わせに含まれる、全てのルール要素の論理積によって表される。
 予測モデルが異種混合学習に基づく予測モデルである場合、予測モデルは、条件式と、重回帰式との組み合わせによって表される。具体的には、予測モデルは、予測モデルを表す木構造における根ノードから葉ノードまでの経路上のノードのうち、葉ノード以外のノードにおける条件式と、葉ノードにおける重回帰式との組み合わせによって表される。そして、上述のように、本実施形態では、根ノードから葉ノードまでの1つの経路上の1つ以上の条件式及び重回帰式が、1つの予測モデルを表す。
 この場合、ルール生成部101は、例えば1つの予測モデルを選択し、選択した予測モデルの葉ノードにおける重回帰式に含まれる説明変数それぞれの説明変数について多くて1つの生成したルール要素を含む、ルール要素の組み合わせを生成する。この場合のルール要素の組み合わせを生成する方法は、予測モデルが重回帰分析に基づく予測モデルである場合における、ルール要素の組み合わせを生成する方法と同様である。ルール生成部101は、さらに、ルール要素の組み合わせ毎に、ルール要素の組み合わせと、選択した予測モデルの条件式とに基づいて、ルールを生成する。ルール生成部101は、組み合わせに含まれる全てのルール要素と、選択した予測モデルの全ての条件式とが、真である場合に真であり、そうでない場合に偽であるように、ルールを生成する。具体的には、ルール生成部101は、ルール要素の組み合わせに含まれる全てのルール要素と、選択した予測モデルの全ての条件式との論理積を表す条件式を、ルールとして生成する。
 ルール生成部101は、生成したルールの各々に、ルール番号を付与する。ルール生成部101は、例えば、後述されるルール提示部103が一度に提示するルールの中で、ルールに対して一意に定まる番号を、ルール番号として付与すればよい。
 サンプルデータ記憶部106は、ルールの評価に使用できる、複数のサンプルを記憶する。サンプルは、個々の対象について、例えば、対象又は環境から抽出された値、対象又は環境を測定することによって得られた値、それらが変換された値などを含むデータである。サンプルは、個々の対象について、さらに、対象に関する事象が発生したか否か(すなわち正解)を特定する情報を含む。
 図8は、サンプルデータ記憶部106が記憶するサンプルの例を模式的に表す図である。図8において「サンプル番号」は、サンプルに付与されている番号である。図8に示す例では、サンプル番号は、サンプルを特定する識別子として使用される。そして、「説明変数名」が、説明変数の識別子として使用される。図8に示す例では説明変数名に、判別結果(正解)が含まれている。判別結果(正解)の値は、サンプル番号によって特定されるサンプルによって表される対象に関する事象が発生したか否かを表す。判別結果(正解)の値は、サンプルの作成者による判別の結果を表していてもよい。図8に示す例では、判別結果(正解)の値が1である場合、対象に関する事象が発生し、判別結果(正解)の値が0である場合、対象に関する事象は発生していない。「値」は、説明変数の値である。
 例えば、対象は顧客であり、事象は顧客が販促に反応することである場合、判別結果(正解)が1であるサンプルは、販促に反応した顧客のデータである。
 ルール評価部102は、ルール生成部101が生成したルールの各々に対して、サンプルデータ記憶部106に格納されているサンプルを使用して、対象に関する事象が発生するか否かを判定する性能の評価を行う。
 ルール評価部102は、まず、ルールが表す評価式の値と、そのルールによる判定の結果との関係を設定する。具体的には、ルール評価部102は、ルールが表す評価式の値が真である場合における、そのルールによる判定の結果が、対象に関する事象が発生することを表すのか、対象に関する事象が発生しないことを表すのかを設定する。さらに、ルール評価部102は、ルールが表す評価式の値が偽である場合における、そのルールによる判定の結果を、その評価式の値が真である場合のそのルールの判定の結果として設定されなかった判定の結果に設定する。以下の説明では、ルールが表す評価式の値と、そのルールによる判定の結果との関係を、「判定種別」と表記する。
 ルール評価部102は、例えば、評価式の値が真である場合における、その評価式が表すルールによる判定の結果を、対象に関する事象が発生することを表すように設定する。その場合、ルール評価部102は、その評価式の値が偽である場合、そのルールによる判定の結果を、対象に関する事象が発生しないことを表すように設定する。以下の説明では、以上のように設定された、評価式の値と判定の結果との関係を、「第1の判定種別」と表記する。
 このケースでは、例えば、対象は顧客であり、事象は顧客が販促に反応することである場合、サンプルに関する評価式の値が真であれば、そのサンプルが得られた顧客は、販促に反応することを表す。また、サンプルに関する評価式が偽であれば、そのサンプルが得られた顧客は、販促に反応しないことを表す。
 ルール評価部102は、例えば、評価式の値が偽である場合における、その評価式が表すルールによる判定の結果を、対象に関する事象が発生することを表すように設定してもよい。その場合、ルール評価部102は、その評価式の値が真である場合、そのルールによる判定の結果を、対象に関する事象が発生しないことを表すように設定してもよい。以下の説明では、以上のように設定された、評価式の値と判定の結果との関係を、「第2の判定種別」と表記する。
 このケースでは、例えば、対象は顧客であり、事象は顧客が販促に反応することである場合、サンプルに関する評価式の値が真であれば、そのサンプルが得られた顧客は、販促に反応しないことを表す。また、サンプルに関する評価式が偽であれば、そのサンプルが得られた顧客は、販促に反応することを表す。
 以下、ルール評価部102において、ルールが表す評価式が真である場合におけるそのルールによる判定の結果は、対象に関する事象が発生することを表すよう設定されている場合について説明する。そして、以下の説明において、ルールが表す評価式が真である場合の、そのルールによる判定の結果を、「正(Positive)」と表記する。さらに、ルールが表す評価式が偽である場合の、そのルールによる判定の結果を、「負(Negative)」と表記する。その場合、正(Positive)は、対象に関する事象が発生することを表す。さらに、負(Negative)は、対象に関する事象が発生しないことを表す。
 例えば、対象は顧客であり、事象は顧客が販促に反応することである場合、Positiveは、顧客が販促に反応することを表す。さらに、Negatieは、顧客が販促に反応しないことを表す。
 ルール評価部102は、説明変数の値が、サンプルに含まれる説明変数の値である場合に、ルールを表す評価式が真であるか偽であるかを判定する。そして、ルール評価部102は、判定の結果と、サンプルデータ記憶部106に格納されているサンプルの、判別結果(正解)の値とを比較する。以下、判別結果(正解)の値を、単に「正解」とも表記する。ルール評価部102は、例えばあらかじめ決められている数のサンプルについて判定、及び、判定の結果と判別結果(正解)との比較を行う。そして、ルール評価部102は、それぞれのルールについて、判定の結果と正解との比較の結果に基づいて、例えば以下に示す、ルールに基づく判別の性能を表す指標値を算出する。ルール評価部102は、以下に示す少なくともいずれかの指標値の代わりに、ルールに基づく判別の性能を表す他の指標値を算出してもよい。ルール評価部102は、以下に示す指標値に加えて、ルールに基づく判別の性能を表す他の指標値を算出してもよい。
 (1)True Positive(以下、「TP」とも表記)
 (2)False Positive(以下、「FP」とも表記)
 (3)True Negative(以下、「TN]とも表記)
 (4)False Negative(以下、「FN」とも表記)
 (5)Precision
 (6)Recall
 (7)F値
 TPは、正解がPositiveであるサンプルのうち、ルールによる判定の結果がPositiveであるサンプルの数を表す。本実施形態では、TPは、対象に関する事象が発生したサンプルのうち、ルールに従った判定の結果、対象に関する事象が発生すると判定されたサンプルの数である。
 FPは、正解がNegativeであるサンプルのうち、ルールによる判定の結果がPositiveであるサンプルの数を表す。本実施形態では、FPは、対象に関する事象が発生していないサンプルのうち、ルールに従った判定の結果、対象に関する事象が発生すると判定されたサンプルの数である。
 TNは、正解がNegativeであるサンプルのうち、ルールによる判定の結果がNegativeであるサンプルの数を表す。本実施形態では、TNは、対象に関する事象が発生していないサンプルのうち、ルールに従った判定の結果、対象に関する事象が発生しないと判定されたサンプルの数である。
 FNは、正解がPositiveであるサンプルのうち、ルールによる判定の結果がNegativeであるサンプルの数を表す。本実施形態では、FNは、対象に関する事象が発生したサンプルのうち、ルールに従った判定の結果、対象に関する事象が発生しないと判定されたサンプルの数である。
 Precisionは、ルールによる判定の結果がPositiveであるサンプルのうち、正解がPositiveであるサンプルの割合である。本実施形態では、Presicionは、ルールに従った判定の結果、対象に関する事象が発生すると判定されたサンプルのうち、対象に関する事象が発生したサンプルの割合を表す。Presicionは、適合率又は精度とも表記される。Precisionは以下の式によって表される。以下の式において、「/」は割り算の演算子である。
 Precision=TP/(TP+FP)
 Recallは、正解がPositiveであるサンプルのうち、ルールによる判定の結果がPositiveであるサンプルの割合である。Recallは、再現率とも表記される。Recallは以下の式によって表される。
 Recall=TP/(TP+FN)
 上述のF値は、PrecisionとRecallの調和平均である。F値は以下の式によって表される。以下の式において、「×」は掛け算の演算子である。
 F値=2×Recall×Precision/(Recall+Precision)
 ルール評価部102は、さらに、PositiveとNegativeの値を入れ替えた場合における、上述の各評価指標を計算してもよい。上述のように、最初に、正(Positive)が、対象に関する事象が発生することを表す場合の指標値を計算した場合、ルール評価部102は、今度は、正(Positive)が、対象に関する事象が発生しないことを表す場合の指標値を計算する。今度は、負(Negative)は、対象に関する事象が発生しないことを表す。
 以下の説明において、PositiveとNegativeの値を入れ替えない場合における指標値を、「第1判定結果における」指標値と表記する。すなわち、上述の第1の判定種別の場合に算出された指標値を、「第1判定結果における」指標値と表記する。さらに、PositiveとNegativeの値を入れ替えた場合における指標値を、「第2判定結果における」指標値と表記する。すなわち、上述の第2の判定種別の場合に算出された指標値を、「第2判定結果における」指標値と表記する。
 第2判定結果における指標値を算出する際、TP、FP、TN、及びFNを再度計算する必要はない。ルール評価部102は、第1判定結果におけるTPを、第2判定結果におけるFNにすればよい。ルール評価部102は、第1判定結果におけるFPを、第2判定結果におけるTNにすればよい。ルール評価部102は、第1判定結果におけるTNを、第2判定結果におけるFPにすればよい。ルール評価部102は、第1判定結果におけるFNを、第2判定結果におけるTPにすればよい。ルール評価部102は、以上のように設定したTP、FP、TN、及びFNを使用して、Precision、Recall、及びF値を算出すればよい。
 ルール評価部102は、ルール番号と判定種別との組み合わせに対して、ルール識別子を付与する。ルール識別子は、例えば、ルール番号と、指標値を算出した際の判定種別を表す値との組み合わせであってもよい。判定種別を表す値は、例えば、あらかじめ定められた、互いに異なる、第1の判定種別を表す値、及び、第2の判定種別を表す値のいずれかである。
 ルール提示部103は、ルール識別子と、そのルールについて算出した指標値とを、例えば端末装置30のユーザに提示する。具体的には、ルール提示部103は、例えば、生成されたルールの各々について、ルール識別子と、そのルールについて算出した指標値とを、端末装置30に送信する。端末装置30は、受信したルールを区別できる情報と、そのルールについて算出した指標値とを表示する。
 図9は、ルール提示部103が提示する指標値の例を模式的に表す図である。図9に示す例では、ルール識別子は、ルール番号と上述の判定種別を表す値とが「-」によってつながれた文字列である。図9に示す例では、各行は、ルール識別子によって表されるルール番号のルール及び判定種別における指標値を表す。図9に示す判定種別では、上述の第1の判定種別を表す値が0であり、第2の判定種別を表す値が1である。また、図9に示す例では、提示される指標値は、TP、FP、TN、FN、Precision、Recall及びF値である。例えば、ルール識別子が「1-0」である行は、ルール番号が「1」であり、判定種別が第1の判定種別である場合における指標値を表す。また、例えば、ルール識別子が「2-1」である行は、ルール番号が「2」であり、判定種別が第2の判定種別である場合における指標値を表す。
 端末装置30のユーザは、例えば端末装置30の入力部(図示されない)を介して、少なくとも1つのルール識別子を選択する。端末装置30は、ユーザによって選択されたルール識別子を、ルール提示部103に送信する。
 ルール提示部103は、受信したルール識別子によって特定されるルール番号及び判定種別における指標値を、端末装置30のユーザにさらに提示してもよい。
 上述のように、端末装置30のユーザは、2つ以上のルール識別子を選択してもよい。その場合、ユーザは、選択したルールを統合する方法を入力してもよい。そして、端末装置30は、入力された、ルールを統合する方法を、ルール提示部103に送信する。選択したルールを統合する方法は、例えば、選択したルールを表す指標式をAND又はOR等の演算子によってつなげた論理式であってもよい。選択したルールを統合する方法は、あらかじめ定められていてもよい。
 ユーザが2つ以上のルール識別子を選択した場合、ルール提示部103は、選択されたルール識別子をルール生成部101に送信する。ルール提示部103は、さらに、例えば端末装置30から受信した、ルールを統合する方法を、ルール生成部101に送信してもよい。その場合、ルール生成部101は、ルールを統合する方法に従ってユーザが選択したルールを統合ことによって、ユーザが選択したルールが統合されたルール(以下、統合ルールと表記)を生成する。そして、ルール評価部102は、統合ルールを使用して、サンプルデータ記憶部106に格納されているサンプルの判定を行う。ルール評価部102は、サンプルの判定結果から、上述の各指標値を算出する。ルール評価部102は、算出した指標値を、ルール提示部103に送信する。ルール提示部103は、受信した、統合ルールによる判定結果から算出された指標値を、端末装置30のユーザに提示する。
 図10は、統合ルールによる判定結果から算出された指標値の例を模式的に表す図である。
 端末装置30のユーザは、再度ルールの選択を行ってもよい。その場合、ルール生成装置10は、再度、ユーザによって選択されたルールにおける指標値を、端末装置30のユーザに提示すればよい。端末装置30のユーザは、選択したルールを採用する指示を入力してもよい。その場合、例えばルール送信部109が、採用されたルールを、判定装置40に送信する。
 判定装置40は、受信したルールに従って、対象に関する事象が発生するか否かを判定する。
 次に、本実施形態の判定システム1の動作について、図面を参照して詳細に説明する。
 図11及び図12は、本実施形態の判定システム1の動作の例を表すフローチャートである。判定システム1は、例えば、端末装置30のユーザによる指示に応じて、図11及び図12に示す動作を開始する。図11に示す動作の開始時において、予測モデル記憶部104は、学習装置20によって生成された予測モデルが格納されている。
 図11を参照すると、まず、ルール生成部101が、予測モデル記憶部104に格納されている予測モデルから、まだ選択されていない予測モデルを選択する(ステップS101)。ルール生成部101は、選択された予測モデルに含まれる説明変数から、まだ選択されていない説明変数を選択する(ステップS102)。ルール生成部101は、選択した説明変数のパラメータを、パラメータ記憶部105から読み出す。上述のように、パラメータは、カテゴリ数、閾値数を含む。パラメータは、上限及び下限をさらに含んでいてもよい。ルール生成部101は、読み出したパラメータを使用して、上述のように、選択した説明変数についてのルール要素を生成する(ステップS104)。
 選択されていない説明変数が存在する場合、すなわち、選択されている予測モデルが、まだ選択されていない説明変数を含んでいる場合(ステップS105においてYES)、判定システム1は、ステップS102以降の動作を繰り返す。選択されていない説明変数が存在しない場合、すなわち、選択されている予測モデルが含む全ての説明変数が選択された場合(ステップS105においてNO)、判定システム1は、次に、ステップS106の動作を行う。
 ステップS106において、ルール生成部101は、生成したルール要素に基づいて、上述のルールを生成する(ステップS106)。そして、選択されていない予測モデルが存在する場合(ステップS107においてYES)、判定システム1は、ステップS101からの動作を繰り返す。選択されていない予測モデルが存在しない場合(ステップS107においてNO)、ルール生成部101は、次に、図12に示すステップS108の動作を行う。
 図12を参照すると、ステップS108において、ルール評価部102は、生成されたルールから1つのルールを選択する。ルール評価部102は、サンプルデータ記憶部106に格納されているサンプルを使用して、選択されたルールによる判定を行う。サンプルデータ記憶部106は、複数のサンプルについて行った判定の結果を使用して、選択したルールの指標値を算出する(ステップS109)。まだ選択されていないルールが存在する場合(ステップS110においてYES)、ルール評価部102は、ステップS108以降の動作を繰り返す。
 まだ選択されていないルールが存在しない場合、すなわち、生成された全てのルールの指標値が算出された場合(ステップS110においてNO)、ルール提示部103は、端末装置30のユーザに、ルールの指標値を提示する(ステップS111)。ステップS111において、ルール提示部103は、指標値の値を使用して、ユーザに提示するルールの指標値を選択してもよい。例えば、ルール提示部103は、ルールのPrecision、Recall、及び、F値の少なくともいずれかが所定の基準より小さい場合、そのルールの指標値を提示しなくてもよい。ルールのPrecision、Recall、及び、F値の基準は、例えば、Precision、Recall、及び、F値のそれぞれについてあらかじめ定められている閾値によって表されていてもよい。
 端末装置30のユーザは、提示されたルールから、1又は複数のルールを選択する。ユーザは、2つ以上のルールと、そのルールを統合する方法とを入力してもよい。端末装置30は、選択されたルールのルール識別子をルール提示部103に送信する。端末装置30は、選択されたルールのルール識別子と、それらのルールを統合する方法とを、ルール提示部103に送信してもよい。
 ルール提示部103は、ユーザによるルールの選択、具体的には、ユーザによって選択されたルールのルール識別子を受信する(ステップS112)。ルール提示部103は、さらに、選択された複数のルールを統合する方法を受信してもよい。
 例えば、新しくルールが選択された場合など、選択されたルールが更新された場合(ステップS113においてYES)、ルール評価部102は、例えば受信した、複数のルールを統合する方法によって、選択されたルールを統合する(ステップS114)。そして、ルール評価部102は、統合されたルールの指標値を算出する(ステップS115)。そして、判定システム1の動作はステップS111に戻り、提示部111は、ステップS111において、統合されたルールの指標値を提示する。その際、提示部111は、統合されていないルールの指標値をさらに提示してもよい。
なお、2以上ではなく、1つのルールが選択された場合、ルール評価部102は、ステップS114及びステップS115の動作を行わない。そして、ステップS111において、提示部111は、選択されたルールの指標値を提示してもよい。
 ステップS111において、端末装置30のユーザは、ルールを選択し直してもよい。端末装置30のユーザは、ルールを選択し直さず、選択されたルールを採用する指示を入力してもよい。同じルールが選択された場合、及び、選択されたルールを採用する指示が入力された場合、ユーザによって選択されたルールは更新されない。ユーザによって選択されたルールは更新されなかった場合(ステップS113においてNO)、ルール送信部109は、選択されたルールを、例えば判定装置40に送信する(ステップS116)。
 以上で説明した本実施形態には、必要な性能に応じてルールを選択できるように、事象の発生を判定するルールを生成することができるという効果がある。
 その理由は、ルール生成部101が複数のルールを生成し、ルール評価部102が、生成されたルールの性能を表す指標値を算出するからである。したがって、ルール評価部102が算出する指標値をもとに、必要な性能に応じてルールを選択することができる。
 <第2の実施形態>
 次に、本発明の第2の実施形態について、図面を参照して詳細に説明する。
 図1は、本実施形態の判定システム1の構成を表すブロック図である。本実施形態の判定システム1は、以下の説明を除いて、第1の実施形態の判定システム1と同じである。本実施形態の判定システム1の、第1の実施形態の構成要素と同じ構成要素には、同じ符号を付与し、その説明を省略する。
 例えば予測モデルが異種混合学習に基づく予測モデルである場合、予測モデルは条件式と予測式(例えば重回帰式)の組み合わせによって表される。異種混合学習に基づく予測モデルを、例えば図3のような木構造によって表した場合、予測モデルは、葉ノード以外のノードにおける条件式と、葉ノードにおける予測式との組み合わせによって表される。その場合、葉ノード以外のノードにおける条件式と、葉ノードにおける予測式に基づく条件式(ルール要素である条件式)とに、同じ説明変数についての条件式が存在する場合がある。その場合、第1の実施形態におけるルールを表す条件式と同様に生成された、ルールを表す条件式は、同じ説明変数についての必ずしも同一でない複数の条件式を含む可能性がある。
 本実施形態のルール生成部101は、例えば、まず、第1の実施形態のルール生成部101と同様に、ルールを生成してもよい。すなわち、本実施形態のルール生成部101は、まず、第1の実施形態のルール生成部101と同様に、ルールを表す条件式を生成してもよい。そして、ルール生成部101は、生成したルールを表す条件式に、同じ説明変数についての複数の条件式が含まれるか否かを判定する。ルールを表す条件式に、同じ説明変数についての複数の条件式が含まれる場合、ルール生成部101は、それらの条件式に含まれる、説明変数の値の範囲の重複部分を特定する。言い換えると、同じ説明変数についての複数の条件式の値が全て真になる、その説明変数の値の範囲を、前述の重複部分として特定する。ルール生成部101は、同じ説明変数についての複数の条件式を、その説明変数の値が、特定した範囲の重複部分に含まれる場合に値が真になる条件式に変更する。本実施形態の説明では、同じ説明変数についての複数の条件式を、その説明変数の値が、特定した範囲の重複部分に含まれる場合に値が真になる条件式に変更することを、「ルール要素のマージ」とも表記する。ルール生成部101は、ルール要素のマージを、複数の条件式が存在する説明変数全てについて行う。
 ルール生成部101は、まず、葉ノードにおける予測式(例えば重回帰式)に基づいて生成されるルール要素の説明変数に、葉ノード以外のノードにおける条件式の説明変数と同じ説明変数があるか否かを特定してもよい。葉ノードにおける予測式に基づいて生成されるルール要素の説明変数に、葉ノード以外のノードにおける条件式の説明変数と同じ説明変数が存在する場合、ルール生成部101は、上述のように、説明変数の値の範囲の重複部分を特定する。そして、ルール生成部101は、その説明変数の値が、特定した範囲の重複部分に含まれる場合に値が真になる条件式を生成する。ルール生成部101は、葉ノードにおける予測式に基づくその説明変数の条件式と、葉ノード以外のノードにおけるその説明変数の条件式とを、生成した条件式に置き換える。そして、ルール生成部101は、生成した条件式に置き換えられた条件式を除く、葉ノードにおける予測式に基づく条件式及び葉ノード以外のノードにおける条件式と、生成した条件式とを使用して、ルールを表す条件式を生成する。
 なお、同じ説明変数についての、葉ノード以外のノードにおける条件式及び葉ノードにおける予測式に基づくルール要素において、その説明変数の値の範囲の重複部分が存在しない場合、その条件式とそのルール要素とを同時に含む条件式の値は、常に偽である。従って、ルール生成部101は、説明変数の値の範囲の重複部分が存在しない、同じ説明変数についての、葉ノード以外のノードにおける条件式及び葉ノードにおける予測式に基づくルール要素を同時に含む条件式が表すルールを生成しなくてよい。
 次に、本実施形態の判定システム1の動作について、図面を参照して詳細に説明する。
 図13及び図12は、本実施形態の判定システム1の動作を表すフローチャートである。図11及び図12に示す、第1の実施形態の判定システム1の動作と比較すると、本実施形態の判定システム1は、図13に示す、ステップS106の動作とステップS107の動作との間に、ステップS201及びステップS202の動作を行う点が異なる。本実施形態の判定システム1の、他のステップにおける動作は、第1の実施形態の判定システム1の、同じ符号が付与されているステップにおける動作と同じである。従って、それらの説明を省略する。
 ステップS201において、ルール生成部101は、生成したルールに、同じ説明変数に関する複数の条件式を含むルールが存在するか判定する。生成したルールに、同じ説明変数に関する複数の条件式を含むルールが存在しない場合(ステップS201においてNO)、本実施形態の判定システム1は、次に、ステップS107の動作を行う。生成したルールに、同じ説明変数に関する複数の条件式を含むルールが存在する場合(ステップS201においてYES)、本実施形態の判定システム1は、次に、ステップS202の動作を行う。
 ステップS202において、ルール生成部101は、同じ説明変数に関する複数の条件式を含むルールについて、上述のルール要素のマージを行う。
 以上で説明した本実施形態には、第1の実施形態と同じ効果がある。その理由は、第1の実施形態の効果が生じる理由と同じである。
 本実施形態には、さらに、処理時間を短縮できるという効果がある。
 その理由は、ルール生成部101が、ルール要素のマージを行うからである。
ルールを表す条件式において、同じ説明変数に関する複数の条件式を、値の範囲の重複部分に関する1つの条件式で表すことができる場合、条件式の数が減少する。その場合、指標を算出する際、同じ説明変数に関する条件式に関する判定を行う回数が減少するので、処理時間を短縮できる。
 <第3の実施形態>
 次に、本発明の第3の実施形態について、図面を参照して詳細に説明する。
 図1は、本実施形態の判定システム1の構成を表すブロック図である。本実施形態の判定システム1は、以下の説明を除いて、第1の実施形態の判定システム1と同じである。本実施形態の判定システム1の、第1の実施形態の構成要素と同じ構成要素には、同じ符号を付与し、その説明を省略する。
 本実施形態のルール生成部101は、同じ説明変数についての2つ以上のルール要素を組み合わせることによって、それらのルール要素の少なくともいずれかが真である場合に真であるルール要素を、新たに生成する。以下の説明において、ルール要素を組み合わせることによって、それらのルール要素の少なくともいずれかが真である場合に真であるルール要素を生成することを、「ルール要素を合成する」と表記する。
 ルール生成部101は、あらかじめ定められている個数のルール要素を組み合わせることによって、ルール要素を合成してもよい。ルール生成部101は、所定範囲に含まれる個数のルール要素を組み合わせることによって、ルール要素を合成してもよい。ルール生成部101は、同じ説明変数の値域を分割することによって得られる値の範囲に基づいて生成されるルール要素の全ての組み合わせについて、ルール要素を合成してもよい。
 ルール生成部101は、各説明変数について、説明変数の地域の分割による値の範囲に基づくルール要素と、合成されたルール要素とから、多くて1つのルール要素を選択し、選択したルール要素を組み合わせることによってルールを生成する。
 次に、本実施形態の判定システム1の動作について、図面を参照して詳細に説明する。
 図14及び図12は、本実施形態の判定システム1の動作の例を表すフローチャートである。
 図14と図11とを比較すると、本実施形態の判定システム1は、ステップS104の動作と、ステップS105の動作との間に、ステップS301の動作を行う。
 ステップS301において、ルール生成部101は、上述のように、ルール要素を合成する。
 また、ステップS106において、ルール生成部101は、合成したルール要素も使用して、ルールを生成する。
 本実施形態の判定システム1は、以上を除いて、第1の実施形態の判定システム1と同じ動作を行う。
 以上で説明した本実施形態には、第1の実施形態と同じ効果がある。その理由は、第1の実施形態の効果が生じる理由と同じである。
 本実施形態には、さらに、ルールの性能を向上させることができるという効果がある。
 その理由は、ルール生成部101がルール要素のマージを行うからである。ルール要素のマージによって生成された範囲に基づくルール要素が選択された場合ルールの性能は、他のルール要素が選択される場合よりルールの性能が高くなる可能性がある。その場合、生成されるルールの性能は向上する。
 本実施形態の判定システム1は、さらに、第2の実施形態の判定システム1と同じ動作を行ってもよい。
 図15及び図12は、その場合の、本実施形態の判定システム1の動作の例を表すフローチャートである。
 図15と図14とを比較すると、図15に示す例では、本実施形態のルール生成部101は、ステップS106の動作とステップS107の動作との間に、ステップS201の動作及びステップS202の動作を行う。その場合のステップS201の動作と、ステップS202の動作は、同じ符号が付与されている第2の実施形態のルール生成部101の動作と同じである。
 この場合の本実施形態には、さらに、第2の実施形態と同じ効果がある。その理由は、第2の実施形態の効果が生じる理由と同じである。
 <第4の実施形態>
 次に、本発明の第4の実施形態について、図面を参照して詳細に説明する。
 図16は、本実施形態のルール生成装置10Aの構成の例を表すブロック図である。
 図16を参照すると、本実施形態のルール生成装置10Aは、ルール生成部101と、ルール評価部102と、を備える。ルール生成部101は、事象を説明する1つ以上の説明変数の値の範囲の組み合わせに基づく、事象が発生するか否かを判定するルールを生成する。ルール評価部102は、生成したルールに、サンプルが適合するか否かを、サンプルの集合について判定した結果に基づいて、ルールの性能を表す指標値を算出する。サンプルは、事象が発生するか否かを表す値と説明変数の値とが関連付けられているデータである。
 図20は、本実施形態のルール生成装置10Aの動作の例を表すフローチャートである。
 図20によると、まず、ルール生成部101が、事象を説明する1つ以上の前記説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成する(ステップS401)。ルール評価部102は、生成したルールに、サンプルが適合するか否かを、サンプルの集合について判定した結果に基づいて、ルールの性能を表す指標値を算出する(ステップS402)。
 以上で説明した本実施形態には、第1の実施形態と同じ効果がある。その理由は、第1の実施形態の効果が生じる理由と同じである。
 <他の実施形態>
 上述の実施形態のルール生成装置10及び10Aは、それぞれ、回路構成(circuitry)によって実現することができる。回路構成は、例えば、1つ以上のメモリと、そのメモリにロードされているプログラムを実行する1つ以上のプロセッサとを含むコンピュータである。回路構成は、通信可能に接続された、2つ以上のコンピュータであってもよい。回路構成は、例えば、専用の、例えば回路(circuit)などのハードウェアである。回路構成は、通信可能に接続された、2つ以上の回路であってもよい。回路構成は、上述のコンピュータと上述の回路との組み合わせであってもよい。
 図17は、ルール生成装置10及び10Aを実現することができる、コンピュータ1000のハードウェア構成の一例を表す図である。図17を参照すると、コンピュータ1000は、プロセッサ1001と、メモリ1002と、記憶装置1003と、I/O(Input/Output)インタフェース1004とを含む。また、コンピュータ1000は、記録媒体1005にアクセスすることができる。メモリ1002と記憶装置1003は、例えば、RAM(Random Access Memory)、ハードディスクなどの記憶装置である。記録媒体1005は、例えば、RAM、ハードディスクなどの記憶装置、ROM(Read Only Memory)、可搬記録媒体である。記憶装置1003が記録媒体1005であってもよい。プロセッサ1001は、メモリ1002と、記憶装置1003に対して、データやプログラムの読み出しと書き込みを行うことができる。プロセッサ1001は、I/Oインタフェース1004を介して、例えば、学習装置20、端末装置30、及び、判定装置40にアクセスすることができる。プロセッサ1001は、記録媒体1005にアクセスすることができる。記録媒体1005には、コンピュータ1000を、ルール生成装置10又はルール生成装置10Aとして動作させるプログラムが格納されている。
 プロセッサ1001は、記録媒体1005に格納されている、コンピュータ1000を、ルール生成装置10又はルール生成装置10Aとして動作させるプログラムを、メモリ1002にロードする。そして、プロセッサ1001が、メモリ1002にロードされたプログラムを実行することにより、コンピュータ1000は、ルール生成装置10又はルール生成装置10Aとして動作する。
 以下の第1グループに含まれる部は、例えば、プログラムを記憶する記録媒体1005からメモリ1002に読み込まれた、各部の機能を実現することができる専用のプログラムと、そのプログラムを実行するプロセッサ1001により実現することができる。第1グループは、ルール生成部101、ルール評価部102、ルール提示部103、予測モデル送受信部107、パラメータ受信部108、及びルール送信部109である。また、以下の第2グループに含まれる部は、コンピュータ1000が含むメモリ1002やハードディスク装置等の記憶装置1003により実現することができる。第2グループに含まれる部は、予測モデル記憶部104、パラメータ記憶部105、及び、サンプルデータ記憶部106である。あるいは、第1グループに含まれる部及び第2グループに含まれる部の一部又は全部を、各部の機能を実現する専用の回路によって実現することもできる。
 図18は、回路によって実装された、本発明の第1、第2、及び、第3の実施形態に係るルール生成装置10の構成の例を表すブロック図である。図19は、回路によって実装された、本発明の第4の実施形態に係るルール生成装置10Aの構成の例を表すブロック図である。
 図18及び図19に示す例において、ルール生成回路1101は、ルール生成部101として動作する。すなわち、ルール生成部101は、ルール生成回路1101によって実現される。ルール評価回路1102は、ルール評価部102として動作する。すなわち、ルール評価部102は、ルール評価回路1102によって実現される。ルール提示回路1103はルール提示部103として動作する。すなわち、ルール提示部103は、ルール提示回路1103によって実現される。予測モデル送受信回路1107は、予測モデル送受信部107として動作する。すなわち、予測モデル送受信部107は、予測モデル送受信回路1107によって実現される。
パラメータ受信回路1108は、パラメータ受信部108として動作する。すなわち、パラメータ受信部108は、パラメータ受信回路1108によって実現される。ルール送信回路1109は、ルール送信部109として動作する。すなわち、ルール送信部109によって実現される。
 同様に、予測モデル記憶装置1104は、予測モデル記憶部104として動作する。すなわち、予測モデル記憶部104は、予測モデル記憶装置1104によって実現される。パラメータ記憶装置1105は、パラメータ記憶部105として動作する。すなわち、パラメータ記憶部105は、パラメータ記憶装置1105によって実現される。サンプルデータ記憶装置1106は、サンプルデータ記憶部106として動作する。すなわち、サンプルデータ記憶部106は、サンプルデータ記憶装置1106によって実現される。予測モデル記憶装置1104、パラメータ記憶装置1105、及び、サンプルデータ記憶装置1106は、それぞれ、記憶回路であってもよい。予測モデル記憶装置1104、パラメータ記憶装置1105、及び、サンプルデータ記憶装置1106は、それぞれ、記憶装置であってもよい。
 また、上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
 (付記1)
 事象を説明する1つ以上の説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成するルール生成手段と、
 生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出するルール評価手段と、
 を備えるルール生成装置。
 (付記2)
 前記説明変数は、前記事象に関する目的変数と当該目的変数を説明する前記説明変数との関連を表す予測モデルに含まれる前記説明変数であり、
 前記ルール生成手段は、同じ前記予測モデルに含まれる前記説明変数の値の範囲の組み合わせに基づく、前記ルールを生成する
 付記1に記載のルール生成装置。
 (付記3)
 前記予測モデルは、前記説明変数の値に関する条件をさらに含み、
 前記ルール生成手段は、前記説明変数の値に関する条件にさらに基づく、前記ルールを生成する
 付記2に記載のルール生成装置。
 (付記4)
 前記ルール生成手段は、前記説明変数の値域を所定の規則に従って分割することによって前記範囲を設定する
 付記1乃至3のいずれか1項に記載のルール生成装置。
 (付記5)
 前記ルール生成手段は、さらに、同じ前記説明変数についての複数の前記範囲の共通な部分を、前記説明変数についての前記範囲として設定する
 付記1乃至4のいずれか1項に記載のルール生成装置。
 (付記6)
 前記ルール生成手段は、さらに、同じ前記説明変数についての、同一ではない複数の前記範囲を組み合わせることによって、前記説明変数についての新しい前記範囲を生成する
 付記1乃至5のいずれか1項に記載のルール生成装置。
 (付記7)
 前記指標値が算出された前記ルール毎に前記指標値を提示し、前記指標値が提示された前記ルールにおいて選択された前記ルールのルール識別子を取得するルール提示手段をさらに備え、
 前記ルール生成手段は、2つ以上の前記ルールが選択された場合、選択された2つ以上の前記ルールが統合された統合ルールを生成する
 付記1乃至6のいずれか1項に記載のルール生成装置。
 (付記8)
 事象を説明する1つ以上の説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成し、
 生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出する
 ルール生成方法。
 (付記9)
 前記事象に関する目的変数と当該目的変数を説明する前記説明変数との関連を表す、
 同じ予測モデルに含まれる前記説明変数の値の範囲の組み合わせに基づく、前記ルールを生成する
 付記8に記載のルール生成方法。
 (付記10)
 前記予測モデルがさらに含む、
 前記説明変数の値に関する条件にさらに基づく、前記ルールを生成する
 付記9に記載のルール生成方法。
 (付記11)
 前記説明変数の値域を所定の規則に従って分割することによって前記範囲を設定する
 付記8乃至10のいずれか1項に記載のルール生成方法。
 (付記12)
 さらに、同じ前記説明変数についての複数の前記範囲の共通な部分を、前記説明変数についての前記範囲として設定する
 付記8乃至11のいずれか1項に記載のルール生成方法。
 (付記13)
 さらに、同じ前記説明変数についての、同一ではない複数の前記範囲を組み合わせることによって、前記説明変数についての新しい前記範囲を生成する
 付記8乃至11のいずれか1項に記載のルール生成方法。
 (付記14)
 前記指標値が算出された前記ルール毎に前記指標値を提示し、前記指標値が提示された前記ルールにおいて選択された前記ルールのルール識別子を取得し、
 2つ以上の前記ルールが選択された場合、選択された2つ以上の前記ルールが統合された統合ルールを生成する
 付記8乃至13のいずれか1項に記載のルール生成方法。
 (付記15)
 コンピュータに、
 事象を説明する1つ以上の説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成するルール生成処理と、
 生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出するルール評価処理と、
 を実行させるルール生成プログラム。
 (付記16)
 前記説明変数は、前記事象に関する目的変数と当該目的変数を説明する前記説明変数との関連を表す予測モデルに含まれる前記説明変数であり、
 前記ルール生成処理は、同じ前記予測モデルに含まれる前記説明変数の値の範囲の組み合わせに基づく、前記ルールを生成する、
 付記15に記載のルール生成プログラム。
 (付記17)
 前記予測モデルは、前記説明変数の値に関する条件をさらに含み、
 前記ルール生成処理は、前記説明変数の値に関する条件にさらに基づく、前記ルールを生成する、
 付記16に記載のルール生成プログラム。
 (付記18)
 前記ルール生成処理は、前記説明変数の値域を所定の規則に従って分割することによって前記範囲を設定する、
 付記15乃至17のいずれか1項に記載のルール生成プログラム。
 (付記19)
 前記ルール生成処理は、さらに、同じ前記説明変数についての複数の前記範囲の共通な部分を、前記説明変数についての前記範囲として設定する
 付記15乃至18のいずれか1項に記載のルール生成プログラム。
 (付記20)
 前記ルール生成処理は、さらに、同じ前記説明変数についての、同一ではない複数の前記範囲を組み合わせることによって、前記説明変数についての新しい前記範囲を生成する
 付記1乃至5のいずれか1項に記載のルール生成装置。
 (付記21)
 コンピュータに、
 前記指標値が算出された前記ルール毎に前記指標値を提示し、前記指標値が提示された前記ルールにおいて選択された前記ルールのルール識別子を取得するルール提示処理を実行させ、
 前記ルール生成処理は、2つ以上の前記ルールが選択された場合、選択された2つ以上の前記ルールが統合された統合ルールを生成する、
 付記15乃至20のいずれか1項に記載のルール生成プログラム。
 以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 この出願は、2015年3月18日に出願された日本出願特願2015-054524を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 1  判定システム
 10  ルール生成装置
 10A  ルール生成装置
 20  学習装置
 30  端末装置
 40  判定装置
 101  ルール生成部
 102  ルール評価部
 103  ルール提示部
 104  予測モデル記憶部
 105  パラメータ記憶部
 106  サンプルデータ記憶部
 107  予測モデル送受信部
 108  パラメータ受信部
 109  ルール送信部
 1000  コンピュータ
 1001  プロセッサ
 1002  メモリ
 1003  記憶装置
 1004  I/Oインタフェース
 1005  記録媒体

Claims (13)

  1.  事象を説明する1つ以上の説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成するルール生成手段と、
     生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出するルール評価手段と、
     を備えるルール生成装置。
  2.  前記説明変数は、前記事象に関する目的変数と当該目的変数を説明する前記説明変数との関連を表す予測モデルに含まれる前記説明変数であり、
     前記ルール生成手段は、同じ前記予測モデルに含まれる前記説明変数の値の範囲の組み合わせに基づく、前記ルールを生成する
     請求項1に記載のルール生成装置。
  3.  前記予測モデルは、前記説明変数の値に関する条件をさらに含み、
     前記ルール生成手段は、前記説明変数の値に関する条件にさらに基づく、前記ルールを生成する
     請求項2に記載のルール生成装置。
  4.  前記ルール生成手段は、前記説明変数の値域を所定の規則に従って分割することによって前記範囲を設定する
     請求項1乃至3のいずれか1項に記載のルール生成装置。
  5.  前記ルール生成手段は、さらに、同じ前記説明変数についての複数の前記範囲の共通な部分を、前記説明変数についての前記範囲として設定する
     請求項1乃至4のいずれか1項に記載のルール生成装置。
  6.  前記ルール生成手段は、さらに、同じ前記説明変数についての、同一ではない複数の前記範囲を組み合わせることによって、前記説明変数についての新しい前記範囲を生成する
     請求項1乃至5のいずれか1項に記載のルール生成装置。
  7.  前記指標値が算出された前記ルール毎に前記指標値を提示し、前記指標値が提示された前記ルールにおいて選択された前記ルールのルール識別子を取得するルール提示手段をさらに備え、
     前記ルール生成手段は、2つ以上の前記ルールが選択された場合、選択された2つ以上の前記ルールが統合された統合ルールを生成する
     請求項1乃至6のいずれか1項に記載のルール生成装置。
  8.  事象を説明する1つ以上の説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成し、
     生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出する
     ルール生成方法。
  9.  前記事象に関する目的変数と当該目的変数を説明する前記説明変数との関連を表す、
     同じ予測モデルに含まれる前記説明変数の値の範囲の組み合わせに基づく、前記ルールを生成する
     請求項8に記載のルール生成方法。
  10.  前記予測モデルがさらに含む、
     前記説明変数の値に関する条件にさらに基づく、前記ルールを生成する
     請求項9に記載のルール生成方法。
  11.  コンピュータに、
     事象を説明する1つ以上の説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成するルール生成処理と、
     生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出するルール評価処理と、
     を実行させるルール生成プログラムを記憶する記録媒体。
  12.  前記説明変数は、前記事象に関する目的変数と当該目的変数を説明する前記説明変数との関連を表す予測モデルに含まれる前記説明変数であり、
     記ルール生成処理は、同じ前記予測モデルに含まれる前記説明変数の値の範囲の組み合わせに基づく、前記ルールを生成、
     ルール生成プログラムを記憶する請求項11に記載の記録媒体。
  13.  前記予測モデルは、前記説明変数の値に関する条件をさらに含み、
     前記ルール生成処理は、前記説明変数の値に関する条件にさらに基づく、前記ルールを生成する、
     ルール生成プログラムを記憶する請求項12に記載の記録媒体。
PCT/JP2016/001456 2015-03-18 2016-03-15 ルール生成装置、ルール生成方法及びルール生成プログラムを記憶する記録媒体 WO2016147654A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017506095A JPWO2016147654A1 (ja) 2015-03-18 2016-03-15 ルール生成装置、ルール生成方法及びルール生成プログラムを記憶する記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015-054524 2015-03-18
JP2015054524 2015-03-18

Publications (1)

Publication Number Publication Date
WO2016147654A1 true WO2016147654A1 (ja) 2016-09-22

Family

ID=56919537

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/001456 WO2016147654A1 (ja) 2015-03-18 2016-03-15 ルール生成装置、ルール生成方法及びルール生成プログラムを記憶する記録媒体

Country Status (2)

Country Link
JP (1) JPWO2016147654A1 (ja)
WO (1) WO2016147654A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019091356A (ja) * 2017-11-16 2019-06-13 東芝映像ソリューション株式会社 システム、方法及びプログラム
CN112631900A (zh) * 2020-12-14 2021-04-09 贝壳技术有限公司 接口的巡检方法、装置、电子设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312408A (ja) * 2000-04-28 2001-11-09 Hitachi Ltd ルール調整方法およびルールを用いたデータ分類方法
WO2008104742A2 (en) * 2007-02-27 2008-09-04 Liverpool John Moores University Rule generation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312408A (ja) * 2000-04-28 2001-11-09 Hitachi Ltd ルール調整方法およびルールを用いたデータ分類方法
WO2008104742A2 (en) * 2007-02-27 2008-09-04 Liverpool John Moores University Rule generation

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019091356A (ja) * 2017-11-16 2019-06-13 東芝映像ソリューション株式会社 システム、方法及びプログラム
CN112631900A (zh) * 2020-12-14 2021-04-09 贝壳技术有限公司 接口的巡检方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
JPWO2016147654A1 (ja) 2018-01-11

Similar Documents

Publication Publication Date Title
JP6703031B2 (ja) キーワードと資産価格との関連性評価方法及びその装置及び資産情報のディスプレイ方法
KR101999471B1 (ko) 정보 추천 방법 및 장치
US9477224B2 (en) Physics-based lifespan modeling
US20180046724A1 (en) Information recommendation method and apparatus, and server
Wauters et al. Study of the stability of earned value management forecasting
US20150227964A1 (en) Revenue Estimation through Ensemble Modeling
CN103106069A (zh) 识别捆绑软件产品组件的方法和系统
US10215814B2 (en) System and method for cognitive alarm management for the power grid
CA3116778A1 (en) Artificial intelligence engine for generating semantic directions for websites for automated entity targeting to mapped identities
WO2014193700A1 (en) Social media pricing engine
CN105447038A (zh) 用于获取用户特征的方法和系统
US20170300819A1 (en) Time-Series Prediction Apparatus and Time-Series Prediction Method
US10102055B1 (en) Data driven converged infrastructure components evaluation
US11687553B2 (en) System and method for generating analytical insights utilizing a semantic knowledge graph
US20190095874A1 (en) Determining validity of service recommendations
JP7034334B2 (ja) 試験装置及び開発支援装置
CN111400126A (zh) 网络服务异常数据检测方法、装置、设备和介质
CN115409283A (zh) 设备故障预测方法、设备故障预测装置、设备及存储介质
WO2016147654A1 (ja) ルール生成装置、ルール生成方法及びルール生成プログラムを記憶する記録媒体
CN111295652A (zh) 将外部数据自动连接到业务分析过程
CN111340540B (zh) 广告推荐模型的监控方法、推荐方法及装置
CN107644042B (zh) 软件程序点击率预估排序方法及服务器
JP2015184818A (ja) サーバ、モデル適用可否判定方法およびコンピュータプログラム
JP6403527B2 (ja) 設計流用支援装置、設計流用支援方法およびプログラム
JP2012181739A (ja) 工数見積装置、工数見積方法、工数見積プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16764485

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017506095

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16764485

Country of ref document: EP

Kind code of ref document: A1