WO2020158266A1 - 評価装置、評価方法及びプログラム - Google Patents

評価装置、評価方法及びプログラム Download PDF

Info

Publication number
WO2020158266A1
WO2020158266A1 PCT/JP2019/050727 JP2019050727W WO2020158266A1 WO 2020158266 A1 WO2020158266 A1 WO 2020158266A1 JP 2019050727 W JP2019050727 W JP 2019050727W WO 2020158266 A1 WO2020158266 A1 WO 2020158266A1
Authority
WO
WIPO (PCT)
Prior art keywords
group
data
unit
groups
calculated
Prior art date
Application number
PCT/JP2019/050727
Other languages
English (en)
French (fr)
Inventor
三資 農添
Original Assignee
パナソニックIpマネジメント株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニックIpマネジメント株式会社 filed Critical パナソニックIpマネジメント株式会社
Priority to US17/423,711 priority Critical patent/US20220083818A1/en
Priority to CN201980089213.7A priority patent/CN113348449A/zh
Priority to JP2020569452A priority patent/JP7398641B2/ja
Publication of WO2020158266A1 publication Critical patent/WO2020158266A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Definitions

  • the present disclosure relates to an evaluation device, an evaluation method and a program, and particularly to an evaluation device, an evaluation method and a program using Mahalanobis distance.
  • the present disclosure has been made in view of the above circumstances, and an object thereof is to provide an evaluation device or the like that can reduce the calculation amount of Mahalanobis distance and shorten the calculation time.
  • an evaluation device includes a unit data group, which is a reference data group for a plurality of data items, and one or more units to be evaluated for the plurality of data items.
  • a unit data group which is a reference data group for a plurality of data items, and one or more units to be evaluated for the plurality of data items.
  • the processor includes a memory, and the processor includes the memory.
  • the unit data group is grouped into two or more groups including at least one item of the plurality of data items, and the unit data group is grouped into the two or more groups.
  • a unit space in each of the above group-based unit data groups is calculated as a group-based unit space, and the calculated group-based unit space is used to calculate a first Mahalanobis distance of the corresponding group-based unit data group, Using each of the calculated unit-by-group unit spaces, the second Mahalanobis distance of the signal data group in the corresponding data item was calculated, and the first linear sum of the calculated first plurality of Mahalanobis distances was calculated and calculated. A second linear sum of the plurality of second Mahalanobis distances is calculated, the calculated first linear sum is compared with the second linear sum, and the comparison result is output as a first comparison result.
  • the calculation amount of Mahalanobis distance can be reduced and the calculation time can be shortened.
  • FIG. 1 is a block diagram showing an example of an evaluation device according to an embodiment.
  • FIG. 2 is a block diagram showing an example of a detailed functional configuration of the arithmetic unit shown in FIG.
  • FIG. 3 is a diagram showing an example of a unit data group and a signal data group in the embodiment.
  • FIG. 4 is a diagram showing an example in which the unit data group shown in FIG. 3 is grouped into two groups.
  • FIG. 5 is a diagram showing an example of the Mahalanobis distance of a unit data group using the unit space for each group according to the embodiment.
  • FIG. 6 is a diagram showing an example of the Mahalanobis distance of the signal data group using the unit space for each group in the embodiment.
  • FIG. 1 is a block diagram showing an example of an evaluation device according to an embodiment.
  • FIG. 2 is a block diagram showing an example of a detailed functional configuration of the arithmetic unit shown in FIG.
  • FIG. 3 is a diagram showing an example of a unit data group and
  • FIG. 7A is a flowchart showing the overall operation of the evaluation device in the embodiment.
  • FIG. 7B is a flowchart showing an example of the detailed operation of step S11 shown in FIG. 7A.
  • FIG. 8 is a conceptual diagram for explaining an overall image of the MT method.
  • FIG. 9 is a diagram illustrating an example of the waveform data according to the first embodiment.
  • FIG. 10 is a graph showing the waveform data shown in FIG.
  • FIG. 11A is a diagram showing MD values of the MT method and MD values of the present method for the waveform data shown in FIG. 9.
  • FIG. 11B is a diagram showing the MD value of the MT method, the MD value of the present method, and the MD value of the multi MT method, which are extracted from FIG. 11A.
  • FIG. 12 is a diagram showing a histogram of the MD value of the MT method, the MD value of the present method, and the MD value of the multi MT method extracted from FIG. 11A.
  • FIG. 13A is a diagram showing calculation results for performing item diagnosis using the MT method for each data item of the signal data group shown in FIG. 11A.
  • FIG. 13B is a diagram showing a calculation result for performing item diagnosis by using the multi-MT method for the MD values for each group of the signal data group shown in FIG. 11A.
  • FIG. 13C is a diagram showing a table used for item diagnosis using this method for each data item of the signal data group shown in FIG. 11A.
  • FIG. 14 is a diagram showing a graph for performing the item diagnosis by the MT method, the multi MT method, and this method for the signal data S1 shown in FIG.
  • FIG. 15 is a diagram showing a graph for performing item diagnosis by the MT method, the multi MT method, and this method on the signal data S2 shown in FIG.
  • FIG. 16 is a diagram showing a graph for performing the item diagnosis by the MT method, the multi MT method, and this method on the signal data S3 shown in FIG.
  • FIG. 17 is a diagram showing a graph for performing the item diagnosis by the MT method, the multi MT method, and this method on the signal data S4 shown in FIG.
  • FIG. 18 is a diagram illustrating an example of a correlation coefficient table in the second embodiment.
  • FIG. 19 is a diagram showing a table in which the correlation coefficients shown in FIG. 18 are listed by a combination of two data items.
  • FIG. 20 is a diagram showing a correlation coefficient when the correlation coefficient shown in FIG. 19 is sorted in descending order, a combination of two data items thereof, and a procedure of grouping into three groups.
  • the MT method (Mahalanobis Taguchi method) is known as a method capable of determining normality or abnormality based on the Mahalanobis distance.
  • data in a normal and homogeneous state is prepared as a unit space that is a group of data regarded as a reference, and the deviation from the pattern of that state is quantified as a Mahalanobis distance.
  • the Mahalanobis distance of the determination target data is calculated, and it is determined whether the determination target data is normal or abnormal based on the distance from the unit space.
  • the Mahalanobis distance is a multidimensional distance that also considers the correlation, and in order to calculate the Mahalanobis distance, it is necessary to calculate the inverse matrix according to the number of feature quantities that are the data items of the group of data in the unit space become. Therefore, there is a problem that it takes a long time to calculate the Mahalanobis distance. Note that the larger the number of data items, the greater the amount of calculation.
  • the present disclosure aims to provide an evaluation device or the like that can reduce the calculation amount of Mahalanobis distance and shorten the calculation time.
  • an evaluation device includes a unit data group that is a reference data group for a plurality of data items, and a signal that is one or more data groups that are an evaluation target for the plurality of data items.
  • the unit space in each of the groups is calculated as a unit space for each group, and the calculated unit space for each group is used to calculate the first Mahalanobis distance of the corresponding unit data group for each group, and the calculated unit for each group Using each space, the second Mahalanobis distance of the signal data group in the corresponding data item is calculated, the first linear sum of the calculated first Mahalanobis distances is calculated, and the calculated second Mahalanobis distances are calculated. A second linear sum of distances is calculated, the calculated first linear sum is compared with the second linear sum, and the comparison result is output as a first comparison result.
  • the unit data group is divided into multiple groups, the Mahalanobis distance of the signal data group is calculated for each group, and the calculated Mahalanobis distance is linearly summed. Then, the signal data group is evaluated.
  • the amount of calculation for performing the Mahalanobis distance such as inverse matrix calculation can be reduced, and thus the calculation time can be shortened.
  • a correlation coefficient indicating a relationship between two data items in all of the plurality of data items of the unit data group is acquired and acquired.
  • the plurality of correlation coefficients are sorted in descending order, the upper limit of the number of data items included in each of the two or more groups is determined, and two data items indicating the correlation coefficient in descending order are determined by the determined number.
  • the groups may be grouped into the two or more groups by classifying into one of the two or more groups according to the upper limit.
  • At least one of the two data items indicating the correlation coefficient overlaps with a data item included in the previously classified group, and is classified into the first.
  • the number of data items included in the determined group is smaller than the determined upper limit of the number, two data items indicating the correlation coefficient may be classified into the previously classified group.
  • the unit data group when the unit data group is grouped into the two or more groups, a correlation coefficient indicating a relationship between two selected data items of the plurality of data items is acquired, and the acquired phase relationship is acquired.
  • the selected two data items are classified into one of the two or more groups in all combinations of the plurality of data items, and the combination is performed in all the combinations. Classify one or more data items that were not classified into one of the two or more groups when exposed to one of the two or more groups that were not classified when performed with all the combinations Therefore, the unit data group may be grouped into the two or more groups.
  • the number of groups in the two or more groups is determined, and the plurality of data items in the unit data group are determined by the determined number of groups. By allocating to each, you may group into said 2 or more groups.
  • the number of data items included in each of the two or more groups is determined, and the plurality of data items in the unit data group are determined.
  • the data items of the number may be grouped into the two or more groups.
  • each linear coefficient for calculating the first linear sum and the second linear sum may be a unit fraction whose denominator is the number of groups in the two or more groups.
  • the processor further compares the calculated plurality of second Mahalanobis distances for each of the signal data items using the memory, and outputs the comparison result as a second comparison result, Based on the second comparison result, item diagnosis may be performed to analyze which of the plurality of data items has become abnormal.
  • an evaluation method is a unit data group that is a reference data group for a plurality of data items, and signal data that is one or more data to be evaluated for the plurality of data items.
  • An evaluation method for a computer to evaluate the signal data group using a Mahalanobis distance from a data set including the group, wherein the unit data group includes at least one or more of the plurality of data items. Grouped into two or more groups, and the unit space in each of the two or more group unit data groups, which is the unit data group grouped into the two or more groups, is calculated as a group unit unit space, and is calculated.
  • a second Mahalanobis distance of the corresponding group-based unit data group is calculated using the group-based unit space, and a second Mahalanobis distance of the signal data group in the corresponding data item is used using each of the calculated group-based unit spaces.
  • a Mahalanobis distance is calculated, a first linear sum of the calculated plurality of first Mahalanobis distances is calculated, a second linear sum of the calculated plurality of second Mahalanobis distances is calculated, and the calculated first linear sum is calculated. The second linear sum is compared and the comparison result is output.
  • a program according to an aspect of the present disclosure is a unit data group that is a reference data group for a plurality of data items, and a signal data group that is one or more data to be evaluated for the plurality of data items.
  • a unit space in each of the two or more group unit data groups, which is the unit data group that is grouped into two or more groups including the above items, is defined as a group unit unit space.
  • the first Mahalanobis distance of the corresponding group-based unit data group is calculated using the calculated group-based unit space, and the signal in the corresponding data item is calculated using each of the calculated group-based unit spaces.
  • Calculating a second Mahalanobis distance of the data group calculating a first linear sum of the calculated plurality of first Mahalanobis distances, calculating a second linear sum of the calculated plurality of second Mahalanobis distances, and calculating the calculated
  • the first linear sum is compared with the second linear sum, and the comparison result is output.
  • FIG. 1 is a block diagram showing an example of the evaluation device 1 according to the present embodiment.
  • the evaluation device 1 calculates Mahalanobis from a data set including a unit data group which is a reference data group for a plurality of data items and a signal data group which is one or more data groups to be evaluated for a plurality of data items. It is for evaluating the signal data group using the distance.
  • the evaluation device 1 is realized by a computer including a processor (microprocessor) such as a CPU and a memory. More specifically, the evaluation device 1 includes a calculation unit 10, a memory 11, an input unit 12, and an output unit 13, as shown in FIG. 1, for example. It is not essential that the evaluation device 1 includes the input unit 12 and the output unit 13.
  • a processor microprocessor
  • the evaluation device 1 includes a calculation unit 10, a memory 11, an input unit 12, and an output unit 13, as shown in FIG. 1, for example. It is not essential that the evaluation device 1 includes the input unit 12 and the output unit 13.
  • the input unit 12 receives a data set including a unit data group, which is a reference data group for a plurality of data items, and a signal data group, which is one or more data groups to be evaluated for a plurality of data items. It The unit data group and the signal data group may be separately input to the input unit 12.
  • the memory 11 is an example of a storage medium, and is composed of a rewritable nonvolatile memory such as a hard disk drive or a solid state drive. In the present embodiment, the memory 11 stores the data set input to the input unit 12.
  • the memory 11 may store a program of a method for calculating Mahalanobis distance in the present embodiment described later, an arithmetic expression used when calculating the Mahalanobis distance, a calculated correlation coefficient, an operation result, and the like.
  • FIG. 2 is a block diagram showing an example of a detailed functional configuration of the calculation unit 10 shown in FIG.
  • the arithmetic unit 10 is, for example, a processor (microprocessor) such as a CPU, and uses the memory 11 or the like to execute calculation using the Mahalanobis distance in order to evaluate the signal data group.
  • a processor microprocessor
  • the unit space calculation unit 101, the MD value calculation unit 102, and the linear sum calculation unit 103 are provided.
  • FIG. 3 is a diagram showing an example of a unit data group and a signal data group in the embodiment.
  • FIG. 4 is a diagram showing an example in which the unit data group shown in FIG. 3 is grouped into two groups.
  • the unit space calculation unit 101 groups the unit data group into two or more groups that include at least one or more items of the plurality of data items, and includes two or more unit data groups that are grouped into two or more groups. A unit space in each of the group-based unit data groups is calculated as a group-based unit space.
  • the unit space calculation unit 101 includes a correlation coefficient calculation unit 1011, a grouping unit 1012, and a group-based unit space calculation unit 1013, as shown in FIG.
  • the correlation coefficient calculation unit 1011 calculates a correlation coefficient indicating the relationship between two data items in all of the plurality of data items of the unit data group. This will be described using the example shown in FIG.
  • the correlation coefficient calculation unit 1011 includes data items 1 and 2, data items 1 and 3, data items 1 and 4, data items 1 and 5, data items 2 and 3, data items 2 and 4, and data items shown in FIG.
  • the correlation coefficient of the unit data of 2 and 5, data items 3 and 4, data items 3 and 5, and data items 4 and 5 is calculated.
  • the correlation coefficient calculation unit 1011 uses y 11 and y 12 , y 21 and y 22 , y 31 and y 32 , y 41 and y 42 , and y 51 and y 52 in the data items 1 and 2.
  • the correlation coefficient is calculated from That is, in FIG. 3, since the unit data group is composed of unit data 1 to unit data 5, the correlation coefficient is calculated from the data of each of unit data 1 to unit data 5 in all combinations of two data items. ..
  • the correlation coefficient calculation unit 1011 first standardizes the unit data of each data item using (Equation 1). As a result, the average value of the Mahalanobis distance (hereinafter, also referred to as MD (Mahalanobis' Distance)) in the unit data group becomes 1.
  • MD Mahalanobis' Distance
  • the correlation coefficient calculation unit 1011 uses the standardized unit data group to calculate the correlation between each data item, that is, the correlation coefficient of the data in the i-th column and the j-th column, using (Equation 2). Can be calculated.
  • the correlation coefficient calculation unit 1011 calculates the correlation coefficients of all the plurality of data items of the unit data group using (Equation 2), it can create the correlation matrix R as in (Equation 3). it can.
  • the MD value calculation unit 102 described later calculates the inverse matrix R ⁇ 1 of the correlation matrix as in (Equation 4), but the correlation coefficient calculation unit 1011 uses the inverse matrix R ⁇ 1. May be calculated.
  • the correlation coefficient calculation unit 1011 does not have to calculate the correlation coefficient indicating the relationship between two data items in all of the plurality of data items from the unit data group.
  • the correlation coefficient calculation unit 1011 may calculate the correlation coefficient between the data items in all the grouped data items. Accordingly, it is not necessary to calculate the correlation coefficient between the two data items in all of the plurality of data items of the unit data group, so that the calculation amount can be reduced. Also, when calculating the inverse matrix, it is sufficient to use the correlation matrix consisting of the correlation coefficient between the data items in all the grouped data items, so reduce the amount of calculation compared to the case without grouping. You can
  • the grouping unit 1012 groups the unit data group into two or more groups that include at least one or more of the plurality of data items. This will be described using the examples shown in FIGS. 3 and 4, and the grouping unit 1012 groups five data items into two groups. More specifically, the data items 1 to 5 are grouped into two groups, a group 1 including the data items 1 and 2 and a group 2 including the data items 3 to 5. In the example shown in FIG. 4, when the number of groups determined in advance is 2, the grouping is performed so that the number of groups becomes 2.
  • the grouping unit 1012 may group the plurality of data items into two or more groups by allocating the plurality of data items in the unit data group to each of the determined number of groups.
  • the grouping method is not limited to the method of using a predetermined number of groups, and may be a method of grouping with a predetermined number of data items, or using a correlation coefficient between data items in a unit data group. It may be a method of doing.
  • the grouping unit 1012 determines the number of data items included in each of the two or more groups and determines a plurality of data items in the unit data group.
  • the items may be grouped into two or more groups by grouping each of the determined number of data items.
  • the grouping unit 1012 may acquire and use the correlation coefficient between the data items in the unit data group calculated by the correlation coefficient calculation unit 1011. More specifically, when the grouping unit 1012 groups the unit data group into two or more groups, the grouping unit 1012 displays a relationship between two data items in all of the plurality of data items of the unit data group. Get the number of relationships. The grouping unit 1012 sorts the obtained plurality of correlation coefficients in descending order and determines the upper limit of the number of data items included in each of the two or more groups. Then, the grouping unit 1012 may group the two data items indicating the correlation coefficient in descending order into one of the two or more groups according to the determined upper limit of the number, to group into the two or more groups.
  • the grouping unit 1012 overlaps one of the two data items indicating the correlation coefficient with the data item included in the previously classified group, and When the number of data items included in the classified group is smaller than the upper limit of the determined number, the two data items indicating the correlation coefficient may be classified into the previously classified group.
  • the grouping unit 1012 may cause the correlation coefficient calculation unit 1011 to calculate the correlation coefficient between the two selected data items and use the threshold value to perform the grouping. More specifically, when the grouping unit 1012 groups the unit data group into two or more groups, the grouping unit 1012 calculates the correlation coefficient indicating the relationship between the selected two data items of the plurality of data items. When the acquired correlation coefficient is greater than or equal to the threshold value, the two selected data items are classified into one of two or more groups. Then, the grouping unit 1012 may perform such classification for all combinations of the plurality of data items. Note that the grouping unit 1012 classifies one or more data items, which are not classified into one of the two or more groups, when all such combinations are performed, when all the combinations are performed. Not classified, it may be classified into one of two or more groups. As described above, the grouping unit 1012 may group the unit data groups into two or more groups by grouping the data items having a high correlation coefficient.
  • the group-based unit space calculation unit 1013 calculates a unit space in each of two or more group-based unit data groups, which is a unit data group grouped into two or more groups, as a group-based unit space. This will be described with reference to the example shown in FIG. decide. More specifically, the unit-by-group space calculation unit 1013 calculates y 11 and y 12 , y 21 and y 22 , y 31 and y 32 , y 41 and y 42 for the data items 1 and 2 of the group 1, and y 51 and y 52 are determined as the unit space for each group of group 1.
  • the unit-by-group space calculation unit 1013 uses y 13 to y 15 , y 23 to y 25 , y 33 to y 35 , y 43 to y 45 , and y 53 to for the data items 3 to 5 of the group 2.
  • y 55 is determined as a unit space for each group of group 2.
  • the group-specific unit space calculation unit 1013 determines the unit space formed by all the unit data belonging to the group 1 and the unit space formed by all the unit data belonging to the group 2 as the unit space by group. To do.
  • the group-specific unit space calculation unit 1013 normalizes each data item in each of the determined group-specific unit spaces, and causes the correlation coefficient calculation unit 1011 to calculate the standardized correlation coefficient of each group-specific unit space. You may get it.
  • the method of standardizing each data item in each unit space for each group and calculating the correlation coefficient is the same as the method using (Equation 1) and (Equation 2) described above, and a description thereof will be omitted.
  • the MD value calculation unit 102 calculates the first Mahalanobis distance of the corresponding group-based unit data group using the calculated group-based unit space. Further, the MD value calculation unit 102 calculates the second Mahalanobis distance of the signal data group in the corresponding data item, using each of the calculated unit spaces for each group.
  • the MD value calculation unit 102 includes a group-specific unit data group MD calculation unit 1021 and a group-specific signal data group MD calculation unit 1022, as shown in FIG.
  • FIG. 5 is a diagram showing an example of the Mahalanobis distance of a unit data group using the unit space for each group according to the embodiment.
  • FIG. 5 shows an example of the Mahalanobis distance of the unit data group shown in FIG. 3, which is calculated using the unit space for each group determined from the groups 1 and 2 shown in FIG. Further, in FIG. 5, the Mahalanobis distance calculated using the unit space for each group of group 1 is shown as MD1. Similarly, the Mahalanobis distance calculated using the group-wise unit space of group 2 is shown as MD2.
  • the group-based unit data group MD calculation unit 1021 calculates the first Mahalanobis distance of the corresponding group-based unit data group using the group-based unit space calculated by the unit space calculation unit 101. This will be described with reference to the examples shown in FIGS.
  • the unit data group MD calculation unit 1021 for each group uses the unit space for each group formed by all the unit data belonging to the groups 1 and 2 shown in FIG. 4, and the Mahalanobis distance of each unit data belonging to the groups 1 and 2. To calculate. More specifically, the group-by-group unit data group MD calculation unit 1021 uses the group-by-group unit space formed by all the unit data belonging to the group 1 shown in FIG. 4 to calculate the Mahalanobis distance for each of the unit data 1 to 5. Calculate certain MDr 11 to MDr 15 .
  • all the unit data belonging to group 1 are y 11 , y 12 , y 21 , y 22 , y 31 , y 32 , y 41 , y 42 , y 51, and y 52 .
  • the group-by-group unit data group MD calculation unit 1021 uses the group-by-group unit space formed by all the unit data belonging to the group 2 shown in FIG. 4, and MDr that is the Mahalanobis distance of each of the unit data 1 to 5. 21 to MDr 25 are calculated.
  • all the unit data belonging to the group 1 are y 13 to y 15 , y 23 to y 25 , y 33 to y 35 , y 43 to y 45 , and y 53 to y 55 .
  • the group-by-group unit data group MD calculation unit 1021 calculates the inverse matrix R ⁇ 1 of the correlation matrix R including the correlation coefficient of each group-by-group unit space. Note that the method of calculating the inverse matrix R ⁇ 1 is the same as the method using (Equation 4) described above, and therefore description thereof is omitted.
  • the group-by-group unit data group MD calculation unit 1021 expresses y, which represents the unit data y ij forming the group unit data group by a column vector, as an average value of the unit data y ij forming the group unit data group. Using m j and standard deviation ⁇ j , a matrix Y normalized as in (Equation 1) is calculated.
  • the first Mahalanobis distance that is, MD of the unit data group for each group is calculated.
  • k is the number of data items of the unit data group for each group.
  • the group-specific unit data group MD calculation unit 1021 can calculate the first Mahalanobis distance, which is a multidimensional distance from the center of the group-specific unit space in the group-specific unit data group.
  • FIG. 6 is a diagram showing an example of the Mahalanobis distance of the signal data group using the unit space for each group in the embodiment.
  • FIG. 6 shows an example of the Mahalanobis distance of the signal data group shown in FIG. 3 calculated using the unit space for each group determined from the groups 1 and 2 shown in FIG. Note that elements similar to those in FIG. 5 are given the same names, and detailed description thereof will be omitted.
  • the group-specific signal data group MD calculation unit 1022 calculates the second Mahalanobis distance of the signal data group in the corresponding data item using each group-specific unit space calculated by the unit space calculation unit 101. This will be described with reference to the examples shown in FIGS.
  • the group-specific signal data group MD calculation unit 1022 uses the group-specific unit space formed by all the unit data belonging to groups 1 and 2 shown in FIG. Calculate each Mahalanobis distance.
  • the group-specific signal data group MD calculation unit 1022 uses the group-specific unit space formed of all the unit data belonging to the group 1 shown in FIG. 4 to calculate the Mahalanobis distance of each of the signal data 1 and 2. MDs 11 and MDs 12 are calculated. Similarly, the group-by-group signal data group MD calculation unit 1022 uses the group-by-group unit space formed by all the unit data belonging to the group 2 shown in FIG. 21 and MDs 22 are calculated.
  • the group-by-group signal data group MD calculation unit 1022 uses the inverse matrix R ⁇ 1 corresponding to each group-by-group unit space calculated by the group-by-group unit data group MD calculation unit 1021 to calculate the signal data group Calculate Mahalanobis distance. More specifically, first, the group-specific signal data group MD calculation unit 1022 represents the data forming the signal data group with a column vector, and the average value m j and the standard deviation ⁇ j used in the corresponding group-specific unit space. Is used to calculate the normalized matrix.
  • the group-by-group signal data group MD calculation unit 1022 uses the calculated column vector in the matrix, its transposed vector, and the inverse matrix R ⁇ 1 corresponding to each unit space by group to show in (Formula 5).
  • the second Mahalanobis distance of the signal data group that is, MD is calculated.
  • the group-specific signal data group MD calculation unit 1022 calculates the second Mahalanobis distance from the multidimensional distance from the center of the group-specific unit space in the signal data group corresponding to the group-specific unit space.
  • the linear sum calculation unit 103 calculates the first linear sum of the plurality of first Mahalanobis distances calculated by the group-specific unit data group MD calculation unit 1021.
  • the linear sum calculation unit 103 also calculates a second linear sum of the plurality of second Mahalanobis distances calculated by the group-specific signal data group MD calculation unit 1022.
  • each linear coefficient for calculating the first linear sum and the second linear sum is a unit fraction whose denominator is the number of groups in the two or more groups.
  • the linear sum calculation unit 103 calculates the first linear sum of the plurality of first Mahalanobis distances of each unit data group calculated by the unit data group MD calculation unit for group 1021. This will be described using the example shown in FIG. 5.
  • the linear sum calculation unit 103 calculates the linear sum of MDr 11 and MDr 21 that are the first Mahalanobis distances of the unit data 1. More specifically, since the linear sum calculation unit 103 has two linear terms, as shown in (Equation 6), the coefficients of the linear terms are set to 1 ⁇ 2, and MDr 11 and MDr 21 By calculating the linear sum, the first linear sum of the unit data 1 is calculated.
  • the linear sum calculation unit 103 calculates the linear sum of MDr 12 and MDr 22 that are the first Mahalanobis distances of the unit data 2 by setting the coefficient of each of the terms in the linear form to 1/2, and calculates the unit data.
  • a linear sum of MDr 13 and MDr 23 which are a plurality of first Mahalanobis distances of 3, is calculated.
  • the linear sum calculation unit 103 calculates the linear sum of MDr 14 and MDr 24 , which are the plurality of first Mahalanobis distances of the unit data 4, by setting the coefficient of each of the linear terms to 1 ⁇ 2, and calculates the linear sum of the unit data 5.
  • the linear sum of MDr 15 and MDr 25 which are the first Mahalanobis distances of, is calculated.
  • the linear sum calculation unit 103 also calculates a second linear sum of the plurality of second Mahalanobis distances of each signal data group calculated by the group-specific signal data group MD calculation unit 1022. This will be described using the example shown in FIG. 6.
  • the linear sum calculation unit 103 calculates the linear sum of MDs 11 and MDs 21 , which are the plurality of second Mahalanobis distances of the signal data 1. More specifically, the linear sum calculation unit 103 calculates the linear sum of MDs 11 and MDs 21 by setting the coefficient of each of the linear terms to 1 ⁇ 2, as shown in (Equation 7), thereby obtaining the signal data.
  • the second linear sum of 1 is calculated.
  • the linear sum calculation unit 103 calculates the second linear sum of the Mahalanobis distance for the number of groups using the unit fraction with the calculated number of grouped groups as the denominator as a coefficient.
  • the respective coefficients in the linear-form terms when calculating the first linear sum and the second linear sum are not limited to those without weighting such as unit fractions having the number of groups as the denominator, and the average of the correlation coefficients. It may be weighted by a value or the like.
  • the output unit 13 compares the first linear sum calculated by the linear sum calculation unit 103 with the second linear sum, and outputs the comparison result as the first comparison result.
  • the output unit 13 may compare the plurality of calculated second Mahalanobis distances for each signal data group and output the comparison result as the second comparison result. For example, if it is determined from the second comparison result that the second linear sum of a certain signal data group has a value considerably larger than the first linear sum of all the unit data groups and is equal to or more than the threshold value, the signal data group It can be determined to be abnormal.
  • the output unit 13 may further perform an item diagnosis for analyzing which data item among the plurality of data items has become abnormal based on the second comparison result, and output the result. For example, when the output unit 13 analyzes that the data item of a certain signal data group has become abnormal as a result of the item diagnosis, the output unit 13 may output warning information that notifies the abnormal data item.
  • FIG. 7A is a flowchart showing the overall operation of the evaluation device 1 according to this embodiment.
  • the evaluation device 1 uses the CPU and the memory to perform the processes of the following steps S11 to S17. More specifically, first, the evaluation device 1 groups the unit data group into two or more groups including at least one or more data items among the plurality of data items (S11). Next, the evaluation device 1 calculates the unit space in each of the two or more group-specific unit data groups that are grouped unit data groups as a group-specific unit space (S12). Next, the evaluation device 1 calculates the first Mahalanobis distance of the corresponding group-specific unit data group using the calculated group-specific unit space (S13). Next, the evaluation device 1 calculates the second Mahalanobis distance of the signal data group in the corresponding data item using each of the calculated unit spaces by group (S14).
  • the evaluation device 1 calculates a first linear sum of the plurality of first Mahalanobis distances calculated in step S13 (S15).
  • the evaluation device 1 uses the plurality of first Mahalanobis distances calculated in step S13 to calculate the first linear sum in each unit data group for each group.
  • the evaluation device 1 calculates the first linear sum of the plurality of second Mahalanobis distances calculated in step S14 (S16).
  • the evaluation device 1 uses the plurality of second Mahalanobis distances calculated in step S14 to calculate the second linear sum in each of the signal data groups corresponding to the unit space for each group.
  • the evaluation device 1 compares the first linear sum calculated in step S15 with the second linear sum calculated in step S16, and outputs the comparison result (S17).
  • step S11 An example of the detailed operation of step S11 will be described below with reference to FIG. 7B.
  • FIG. 7B is a flowchart showing an example of the detailed operation of step S11 shown in FIG. 7A.
  • FIG. 7B shows a detailed operation in the case of grouping unit data groups into two or more groups by grouping data items having a high correlation coefficient.
  • step S11 first, the evaluation device 1 acquires the correlation coefficient between the data items of the unit data group (S111).
  • the evaluation device 1 acquires the correlation coefficient between the data items of the unit data group by calculating from the two unit data of each data item of the unit data group.
  • the evaluation device 1 sorts the acquired correlation coefficients in descending order (S112), and forms two data items indicating the highest correlation coefficient as one group (S113).
  • the evaluation device 1 acquires two data items indicating the correlation coefficient having the next highest value (S114), and both of the acquired two data items are the data items forming the group being formed. It is determined whether or not they overlap (S115).
  • step S115 the evaluation device 1 determines whether any of the two acquired data items overlaps with the data items forming the group being formed (S116).
  • step S116 If there is no overlap in step S116 (no in S116), and both data items do not overlap with the data items forming the completed group (no in S117), the evaluation device 1 separates the two non-overlapping data items from each other. They are formed as a group (S118). In addition, in step S115, when it overlaps with the data items forming the completed group (yes in S117), the evaluation device 1 returns to step S116 without doing anything.
  • step S116 the evaluation device 1 adds the two data items to the overlapping group (S119) and confirms whether the number of data items in the group has reached the upper limit. Yes (S120).
  • step S120 When it is confirmed in step S120 that the upper limit is reached (yes in S120), the evaluation device 1 treats the group as completed (S121), and confirms whether there is another group being formed (step S120). S122).
  • step S122 if there is no other group being formed (no in S122), all the remaining data items are formed as one group (S123), and the process ends.
  • step S115 if there is an overlap (yes in S115), in step S117, if at least one of the data items overlaps with a data item forming a completed group (yes in S117), the process returns to step S114. repeat. If the upper limit is not reached in step S120 (no in S120), and if there is another group being formed in step S122 (yes in S122), the process returns to step S114 to repeat the process.
  • the evaluation device 1 groups the unit data group into two or more groups by grouping the plurality of data items of the unit data group into two or more groups.
  • the evaluation device 1 divides the unit data group into a plurality of groups by grouping the plurality of data items of the unit data group, and calculates the Mahalanobis distance of the signal data group for each group, Calculate the linear sum of the calculated Mahalanobis distances. Then, the signal data group is evaluated by the calculated linear sum. Accordingly, the evaluation device 1 can reduce the amount of calculation for performing the Mahalanobis distance such as the inverse matrix calculation even if the number of data items is large, so that the calculation time can be shortened. For example, when no grouping is performed, the series of calculation amounts for calculating the Mahalanobis distance is a calculation amount proportional to the cube of the number of items. On the other hand, in the case of grouping as in the present embodiment, the calculation amount obtained by dividing the square of the number of groupings by the calculation amount without grouping can be reduced.
  • FIG. 8 is a conceptual diagram for explaining the overall image of the MT method.
  • the production facility data may be, for example, physical data such as time-series temperature data for each position of the facility separated by a constant interval, physical data for a product of each facility, or physical data that has been characterized. It may be scalar data.
  • the feature quantities 1 to k are extracted from the acquired data, and for example, the feature quantities 1 to k and the data are arranged in a table type.
  • the characteristic amount include a differential characteristic value of physical data, an integral characteristic value, a waveform characteristic value, a maximum value and a minimum value.
  • waveform data is extracted from production facility data such as temperature, and the waveform data is arranged in a table type for data items.
  • OK data that is, unit data 1 to m regarded as normal
  • a unit space is generated.
  • the generated correlation matrix of the unit space and the inverse matrix of the correlation matrix are calculated in advance.
  • MD value Mahalanobis distance
  • the signal data m+1 to n is determined to be NG data, that is, not normal, item diagnosis may be performed for the signal data m+1 to n, and the degree of influence of factors for each item may be analyzed.
  • the unit space shown in FIG. 8 is not used for all the extracted feature amounts 1 to k, but for each grouped feature amount 1 to k, that is, for each group unit data, Generate as. Then, the MD value and the item diagnosis of the signal data m+1 to n are performed on the signal data m+1 to n for each grouped feature amount 1 to k using the unit space for each group.
  • Example 1 An example of a specific mode of the evaluation method performed by the evaluation device 1 in the above-described embodiment will be described as Example 1.
  • FIG. 9 is a diagram showing an example of the waveform data in the first embodiment.
  • FIG. 10 is a graph showing the waveform data shown in FIG.
  • the waveform data shown in FIG. 9 is extracted from the data set stored in the memory 11 and is a unit data group (U1 to U26) that is a reference data group used to form a unit space and is an evaluation target. It is composed of a signal data group (S1 to S4) which is a data group.
  • the waveform data shown in FIG. 9 is arranged in a table type for each data item shown as WAVE1 to WAVE12. Note that the hatched columns in FIG. 9 show the values of the signal data group deviating from the unit data group (U1 to U26) shown in FIG. As shown in FIG.
  • the signal data S1 has a similar change or shape of values in a plurality of data items (WAVE1 to WAVE12), but the overall Is small.
  • the signal data S2 compared with the unit data group (U1 to U26), the values and changes in the values in the plurality of data items (WAVE1 to WAVE12) are similar, but they are deviated by the value of WAVE7.
  • the signal data S3 compared with the unit data group (U1 to U26), the values and changes of the values in the plurality of data items (WAVE1 to WAVE12) are similar, but the values of WAVE1, 2, and 3 are deviated. ..
  • the values and changes of the values in the plurality of data items are similar, but the values of WAVE10 and WAVE11 are downward sloping. There is.
  • FIG. 11A is a diagram showing MD values of the MT method and MD values of the present method for the waveform data shown in FIG. 9.
  • the MD value of this method is calculated by the evaluation device 1 according to the above-described embodiment, and is calculated using a group-based unit space formed by grouping a plurality of data items and dividing the unit data group into a plurality of groups. It is a linear sum of multiple Mahalanobis distances.
  • the unit data group is divided into three groups of four data items (WAVE1 to WAVE12) (WAVE1 to WAVE4, WAVE5 to WAVE8, WAVE9 to WAVE12).
  • the MD value for each unit data was calculated using the group-specific unit space formed from the unit data group divided into three groups.
  • MD values for each unit data (U1 to U26) calculated using the unit space for each group are shown as MD values for each group (MD1_1, MD1_2, MD1_3).
  • FIG. 11A also shows MD values of the multi MT method for the waveform data shown in FIG. 9 as a comparative example.
  • the MD value of the multi MT method is one Mahalanobis distance calculated by inputting the calculated Mahalanobis distances by grouping a plurality of data items and calculating the Mahalanobis distances in each group.
  • the calculation amount is larger than the MD value of the MT method without grouping and the MD value of this method that calculates the Mahalanobis distance of grouping but one layer. Will increase. That is, both the MD value and the multi MT method of this method use a method called grouping, but the amount of calculation required for the MD value of this method is smaller than the amount of calculation required for the multi MT method.
  • FIG. 11B is a diagram showing the MD value of the MT method, the MD value of the present method, and the MD value of the multi MT method extracted from FIG. 11A.
  • FIG. 12 is a diagram showing a histogram of the MD value of the MT method, the MD value of the present method, and the MD value of the multi MT method extracted from FIG. 11A.
  • 12A shows a histogram of MD values of the MT method extracted from FIG. 11A
  • FIG. 12B shows a histogram of MD values of the multi MT method extracted from FIG. 11A.
  • 12(c) shows a histogram of MD values of this method extracted from FIG. 11A.
  • the MD value of this method and the MD value of the MT method show the same tendency. Accordingly, by using the MD value of the present method instead of the MD value of the MT method, not only the amount of calculation can be reduced as compared with the MD value of the MT method, but also the same determination as when the MD value of the MT method is used. I see that you can.
  • the MD value of the multi MT method for the signal data S1 to S4 is too large with respect to the MD value of the unit data group divided into three groups (unit data group for each group). Therefore, it can be understood that the signal data S1 cannot be treated as a gray zone by determining whether it is normal or abnormal, and correct determination is difficult.
  • FIG. 13A is a diagram showing calculation results for performing item diagnosis using the MT method for each data item of the signal data group shown in FIG. 11A.
  • a value calculated by using an orthogonal table is written for the influence of the data item of WAVE1.
  • the correlation matrix of a plurality of data items WAVE2 to WAVE12 is calculated, and the inverse matrix of the calculated correlation matrix is used.
  • FIG. 13A also shows the MD value of the MT method for each signal data so that it can be compared with the value written in the data item.
  • FIG. 13B is a diagram showing a calculation result for performing item diagnosis using the multi-MT method for the MD values for each group of the signal data group shown in FIG. 11A.
  • a value obtained by calculating the influence of MD1_1 using the orthogonal table is entered in the same manner as above. The same applies to the values entered in other items.
  • FIG. 13A also shows MD values of the multi MT method for each of the signal data so that the values can be compared with the values entered in the item.
  • FIG. 13C is a diagram showing a table used for item diagnosis using this method for each data item of the signal data group shown in FIG. 11A.
  • FIG. 13C shows a table in which the MD values (MD1_1, MD1_2, MD1_3) for each group shown in FIG. 11A are extracted.
  • FIG. 14 is a diagram showing a graph for performing item diagnosis by the MT method, the multi MT method, and this method for the signal data S1 shown in FIG.
  • FIG. 14A shows a graph for performing item diagnosis by the MT method on the signal data S1
  • FIG. 14B shows a graph for performing item diagnosis by the multi MT method on the signal data S1. It is shown.
  • FIG. 14C shows a graph for performing item diagnosis by the present method on the signal data S1.
  • FIG. 15 is a diagram showing a graph for performing item diagnosis by the MT method, the multi MT method, and this method for the signal data S2 shown in FIG. FIG.
  • FIG. 16 is a diagram showing a graph for performing the item diagnosis by the MT method, the multi MT method, and this method on the signal data S3 shown in FIG.
  • FIG. 17 is a diagram showing a graph for performing the item diagnosis by the MT method, the multi MT method, and this method on the signal data S4 shown in FIG.
  • FIGS. 15A to 17A show graphs for performing item diagnosis by the MT method on the signal data S2 to S4.
  • FIGS. 15 to 17(b) show graphs for performing item diagnosis by the multi MT method on the signal data S2 to S4, and
  • FIGS. 15 to 17(c) show the signal data S2 to A graph for performing item diagnosis by the present MT method for S4 is shown.
  • the graphs for performing the item diagnosis of this method and the graphs for performing the item diagnosis of the multi MT method show the same tendency for the signal data S1 to S4.
  • the item diagnosis of the present method and the item diagnosis of the multi MT method have the same performance, so that the item diagnosis of the present method can be used instead of the item diagnosis of the multi MT method.
  • the MD values for each group of the signal data group can be used as they are, the calculation of the correlation matrix and the inverse matrix performed in the item diagnosis of the multi MT method becomes unnecessary, and the calculation amount can be reduced.
  • the MD value of the data item of WAVE7 is outstanding, and the data item of WAVE7 is the signal. It can be seen that the data S2 is the cause of the determination of abnormality.
  • the MD value for each group of MD1_2 consisting of four data items (WAVE1 to WAVE12) including WAVE7 is projected, and MD1_2 is the signal data. It can be seen that S2 is the cause of the determination of abnormality.
  • the four data items (WAVE1 to WAVE12) that make up MD1_2 determined to be abnormal by the item diagnosis of this method are further subjected to the MT method item diagnosis, whereby the WAVE7 data item and the signal data S2 are abnormal. It can be seen that the cause is determined.
  • the graphs for performing the item diagnosis of the other signal data S3 and S4 the explanation is omitted, but the same thing can be understood.
  • the item diagnosis of this method is performed, and the item diagnosis of the MT method is further performed on the data items that make up the group determined to be abnormal. It can be seen from this that not only the amount of calculation can be reduced as compared with the item diagnosis of the MT method performed for all data items, but also the same analysis as the item diagnosis of the MT method performed for all data items can be performed.
  • the calculation amount for performing the Mahalanobis distance such as the inverse matrix calculation can be reduced, and thus the calculation time can be shortened. be able to.
  • FIG. 18 is a diagram showing an example of a correlation coefficient table in the second embodiment.
  • FIG. 18 shows the correlation coefficient between the data items of the waveform data shown in FIG.
  • the correlation coefficient shown in FIG. 18 is calculated by the evaluation device 1 in the embodiment.
  • FIG. 19 is a diagram showing a table in which the correlation coefficients shown in FIG. 18 are listed by a combination of two data items. This listing may be performed by the evaluation device 1 in the embodiment.
  • the number of the combination in the table of FIG. 19 indicates the combination of the data item number of the first line in FIG. 18, that is, Wave1 to Wave12, and the data item number of the first column of FIG. 18, that is, the wave item of Wave1 to Wave12. ing.
  • the correlation coefficient 0.922252 between Wave1 on the first row in FIG. 18 and Wave2 on the second column in FIG. 18 is shown.
  • the correlation coefficient shown in FIG. 19 is calculated by the evaluation device 1 in the embodiment.
  • FIG. 20 is a diagram showing a correlation coefficient when the correlation coefficient shown in FIG. 19 is sorted in descending order, a combination of the two data items, and a procedure of grouping into three groups.
  • the combination 2-3 having the highest correlation coefficient of 0.934755 is set as the first eye group 1. Since the combination 6-8 having the next highest correlation coefficient of 0.929843 does not overlap with the numbers of the combinations included in the group 1, that is, the data items, the combination 6-8 is set as another group, that is, the group 2.
  • the combination 1-2 showing the next highest correlation coefficient 0.922252 overlaps with the combination number 2 included in the group 1, so the combination 1-2 is added to the group 1.
  • the combination 3-4 having the next highest correlation coefficient 0.916117 overlaps with the combination number 3 included in the group 1, so the combination 3-4 is added to the group 1.
  • the combination included in group 1 becomes 1-2-3-4, and the number of data items reaches the upper limit. Therefore, group 1 is treated as completed.
  • the combination 2-4 showing the next highest correlation coefficient 0.901614 is included in the group 1, so nothing is done. Since the data items included in group 1 do not change even if combination 2-4 is added to group 1, combination 2-4 may be added to group 1. Next, since the combination 1-3 showing the high correlation coefficient of 0.896364 is also included in the group 1, nothing is done.
  • the combination 5-6 showing the next highest correlation coefficient of 0.893529 overlaps with the combination number 6 included in the group 2, so the combination 5-6 is added to the group 2.
  • the number of combinations included in group 2 becomes 5-6-7-8, and the number of data items reaches the upper limit. Therefore, group 2 is treated as completed.
  • the evaluation device 1 can use the correlation coefficient between the data items in the unit data group to group the unit data group into two or more groups.
  • the number of data items and the number of groups are determined in advance. However, even when only the number of data or only the number of groups is determined, it is possible to perform grouping in steps corresponding to them.
  • the evaluation device, the evaluation method, and the program according to the present disclosure have been described in the above embodiments, the subject and the device that perform each process are not particularly limited. It may be processed by a processor or the like (described below) embedded in a particular locally located device. It may also be processed by a cloud server or the like arranged in a place different from that of the local device.
  • the present disclosure is not limited to the above embodiment.
  • another embodiment realized by arbitrarily combining the components described in the present specification and excluding some of the components may be an embodiment of the present disclosure.
  • the present disclosure also includes modified examples obtained by applying various modifications that the person skilled in the art can think of to the above-described embodiment without departing from the gist of the present disclosure, that is, the scope of the wording described in the claims. Be done.
  • the present disclosure further includes the following cases.
  • the above device is specifically a computer system including a microprocessor, a ROM, a RAM, a hard disk unit, a display unit, a keyboard, a mouse, and the like.
  • a computer program is stored in the RAM or the hard disk unit.
  • Each device achieves its function by the microprocessor operating according to the computer program.
  • the computer program is configured by combining a plurality of instruction codes indicating instructions to the computer in order to achieve a predetermined function.
  • Part or all of the constituent elements of the above device may be composed of one system LSI (Large Scale Integration).
  • the system LSI is a super multifunctional LSI manufactured by integrating a plurality of constituent parts on one chip, and specifically, is a computer system including a microprocessor, ROM, RAM and the like. .. A computer program is stored in the RAM. The system LSI achieves its function by the microprocessor operating according to the computer program.
  • Part or all of the constituent elements of the above device may be composed of an IC card that can be attached to and detached from each device or a single module.
  • the IC card or the module is a computer system including a microprocessor, ROM, RAM and the like.
  • the IC card or the module may include the above super-multifunctional LSI.
  • the IC card or the module achieves its function by the microprocessor operating according to the computer program. This IC card or this module may be tamper resistant.
  • the present disclosure may be the method described above. Further, it may be a computer program that realizes these methods by a computer, or may be a digital signal including the computer program.
  • a computer-readable recording medium for reading the computer program or the digital signal for example, a flexible disk, a hard disk, a CD-ROM, an MO, a DVD, a DVD-ROM, a DVD-RAM, a BD ( It may be recorded on a Blu-ray (registered trademark) Disc), a semiconductor memory, or the like. Further, the digital signal recorded on these recording media may be used.
  • the present disclosure may be a computer system including a microprocessor and a memory, the memory stores the computer program, and the microprocessor may operate according to the computer program.
  • the program or the digital signal is recorded on the recording medium and transferred, or the program or the digital signal is transferred via the network or the like, thereby being implemented by another independent computer system. You may.
  • the present disclosure can be used for an evaluation device, an evaluation method, and a program that use Mahalanobis distance, and in particular, can be used for an evaluation device, an evaluation method, and a program that are used to determine abnormalities in production equipment.

Abstract

本開示の評価装置は、単位データ群を、複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし(S11)、2以上のグループにグルーピングされた単位データ群である2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し(S12)、算出したグループ別単位空間を用いて、対応するグループ別単位データ群の第1マハラノビス距離と、対応するデータ項目における信号データ群の第2マハラノビス距離とを算出し(S13、S14)、算出した複数の第1マハラノビス距離の第1線形和と、算出した複数の第2マハラノビス距離の第2線形和とを算出し(S15、S16)、算出した第1線形和と第2線形和とを比較して、比較した結果を第1比較結果として出力する(S17)。

Description

評価装置、評価方法及びプログラム
 本開示は、評価装置、評価方法及びプログラムに関し、特にマハラノビス距離を用いた評価装置、評価方法及びプログラムに関する。
 マハラノビス距離を利用したパターン認識における異常原因診断方法が提案されている(例えば、特許文献1)。特許文献1に記載された発明では、マハラノビス距離を求めた後、i番目の要素について距離要素値と他の要素に対する相関係数との積の絶対値を計算し、その計算結果の中から、要素ごとの最大値を抽出する。
特開2005-267474号公報
 しかしながら、特許文献1に開示されている技術では、マハラノビス距離の計算を行うためには、データ項目となる特徴量の数に応じた逆行列計算等が必要になるため、計算時間がかかるという問題がある。このため、マハラノビス距離を利用した異常原因診断を行う場合にも計算時間がかかることになる。
 本開示は、上述の事情を鑑みてなされたもので、マハラノビス距離の計算量を削減し、計算時間を短縮することができる評価装置等を提供することを目的とする。
 上記課題を解決するために、本開示の一形態に係る評価装置は、複数のデータ項目についての基準となるデータ群である単位データ群、及び前記複数のデータ項目についての評価対象となる1以上のデータ群である信号データ群を含むデータセットから、マハラノビス距離を用いて前記信号データ群の評価を行うための評価装置であって、プロセッサと、メモリと、を備え、前記プロセッサは、前記メモリを用いて、前記単位データ群を、前記複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、前記2以上のグループにグルーピングされた前記単位データ群である前記2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し、算出した前記グループ別単位空間を用いて、対応する前記グループ別単位データ群の第1マハラノビス距離を算出し、算出した前記グループ別単位空間それぞれを用いて、対応するデータ項目における前記信号データ群の第2マハラノビス距離を算出し、算出した複数の前記第1マハラノビス距離の第1線形和を算出し、算出した複数の前記第2マハラノビス距離の第2線形和を算出し、算出した前記第1線形和と前記第2線形和とを比較して、比較した結果を第1比較結果として出力する。
 なお、これらの全般的または具体的な態様は、装置、方法、システム、集積回路、コンピュータプログラムまたはコンピュータで読み取り可能なCD-ROMなどの記録媒体で実現されてもよく、装置、方法、システム、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
 本開示の評価装置等によれば、マハラノビス距離の計算量を削減し、計算時間を短縮することができる。
図1は、実施の形態における評価装置の一例を示すブロック図である。 図2は、図1に示す演算部の詳細機能構成の一例を示すブロック図である。 図3は、実施の形態における単位データ群と信号データ群との一例を示す図である。 図4は、図3に示す単位データ群を2つのグループにグルーピングした場合の例を示す図である。 図5は、実施の形態におけるグループ別単位空間を用いた単位データ群のマハラノビス距離の一例を示す図である。 図6は、実施の形態におけるグループ別単位空間を用いた信号データ群のマハラノビス距離の一例を示す図である。 図7Aは、実施の形態における評価装置の全体動作を示すフローチャートである。 図7Bは、図7Aに示すステップS11の詳細動作の一例を示すフローチャートである。 図8は、MT法の全体像を説明するための概念図である。 図9は、実施例1における波形データの一例を示す図である。 図10は、図9に示す波形データをグラフに表した図である。 図11Aは、図9に示す波形データに対するMT法のMD値と本手法のMD値とを示す図である。 図11Bは、図11Aから抜粋した、MT法のMD値と本手法のMD値とマルチMT法のMD値とを示す図である。 図12は、図11Aから抜粋した、MT法のMD値と本手法のMD値とマルチMT法のMD値とのヒストグラムを示す図である。 図13Aは、図11Aに示す信号データ群の各データ項目に対してMT法を用いて項目診断を行うための計算結果を示す図である。 図13Bは、図11Aに示す信号データ群のグループ別MD値に対してマルチMT法を用いて項目診断を行うための計算結果を示す図である。 図13Cは、図11Aに示す信号データ群の各データ項目に対して本手法を用いて項目診断を行うために用いた表を示す図である。 図14は、図9に示す信号データS1に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。 図15は、図9に示す信号データS2に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。 図16は、図9に示す信号データS3に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。 図17は、図9に示す信号データS4に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。 図18は、実施例2における相関係数表の一例を示す図である。 図19は、図18に示す相関係数を、2つのデータ項目の組み合わせでリスト化した表を示す図である。 図20は、図19に示す相関係数が降順にソートされたときの相関係数及びその2つのデータ項目の組み合わせと、3つのグループにグルーピングした手順とを示す図である。
 (本開示の基礎となった知見)
 マハラノビス距離に基づいて、正常または異常の判定を行うことができる方法としてMT法(マハラノビス・タグチ法)が知られている。MT法では、基準とみなすデータの群である単位空間として、正常で均質な状態のデータを用意し、その状態が持つパターンからのズレをマハラノビス距離として数値化する。そして、判定対象のデータのマハラノビス距離を計算し、単位空間からの離れ具合から、判定対象のデータが正常または異常であるかを判定する。
 マハラノビス距離は、相関性も考慮した多次元の距離であり、マハラノビス距離の計算を行うためには、単位空間のデータの群のデータ項目となる特徴量の数に応じた逆行列計算等が必要になる。このため、マハラノビス距離の計算には計算時間がかかるという問題がある。なお、データ項目の数が多くなれば計算量がより増える。
 そこで、本開示は、マハラノビス距離の計算量を削減し、計算時間を短縮することができる評価装置等を提供することを目的とする。
 すなわち、本開示の一形態に係る評価装置は、複数のデータ項目についての基準となるデータ群である単位データ群、及び前記複数のデータ項目についての評価対象となる1以上のデータ群である信号データ群を含むデータセットから、マハラノビス距離を用いて前記信号データ群の評価を行うための評価装置であって、プロセッサと、メモリと、を備え、前記プロセッサは、前記メモリを用いて、前記単位データ群を、前記複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、前記2以上のグループにグルーピングされた前記単位データ群である前記2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し、算出した前記グループ別単位空間を用いて、対応する前記グループ別単位データ群の第1マハラノビス距離を算出し、算出した前記グループ別単位空間それぞれを用いて、対応するデータ項目における前記信号データ群の第2マハラノビス距離を算出し、算出した複数の前記第1マハラノビス距離の第1線形和を算出し、算出した複数の前記第2マハラノビス距離の第2線形和を算出し、算出した前記第1線形和と前記第2線形和とを比較して、比較した結果を第1比較結果として出力する。
 この構成により、単位データ群の複数のデータ項目をグルーピングすることで、単位データ群を複数のグループに分割し、当該グループ毎に信号データ群のマハラノビス距離を算出し、算出したマハラノビス距離を線形和したもので、信号データ群を評価する。これにより、逆行列計算などマハラノビス距離を行うための計算量を削減できるので、計算時間を短縮することができる。
 また、例えば、前記単位データ群を前記2以上のグループにグルーピングする場合、前記単位データ群の前記複数のデータ項目のすべてにおける2つのデータ項目の間の関係を示す相関係数を取得し、取得した複数の前記相関係数を降順にソートし、前記2以上のグループそれぞれに含まれるデータ項目の数の上限を決定し、降順に相関係数を示す2つのデータ項目を、決定した前記数の上限に従って、前記2以上のグループの1つに分類することで、前記2以上のグループにグルーピングするとしてもよい。
 ここで、例えば、前記1つに分類する際、前記相関係数を示す2つのデータ項目のうち少なくとも一方が、先に分類されたグループに含まれるデータ項目と重複し、かつ、前記先に分類されたグループに含まれるデータ項目の数が、決定した前記数の上限より小さい場合に、前記相関係数を示す2つのデータ項目を前記先に分類されたグループに分類するとしてもよい。
 また、例えば、前記単位データ群を前記2以上のグループにグルーピングする場合、前記複数のデータ項目のうち選択した2つのデータ項目の間の関係を示す相関係数を取得し、取得した前記相関係数が閾値以上であるときに、選択した前記2つのデータ項目を、前記2以上のグループの1つに分類することを、前記複数のデータ項目のすべての組み合わせで行い、前記すべての組み合わせで行われた際、前記2以上のグループの1つに分類されなかった1以上のデータ項目を、前記すべての組み合わせで行われた際に分類されなかった、前記2以上のグループの1つに分類することで、前記単位データ群を前記2以上のグループにグルーピングするとしてもよい。
 また、例えば、前記単位データ群を前記2以上のグループにグルーピングする場合、前記2以上のグループにおけるグループの数を決定し、前記単位データ群における前記複数のデータ項目を、決定した前記数のグループそれぞれに振り分けることで、前記2以上のグループにグルーピングするとしてもよい。
 また、例えば、前記単位データ群を前記2以上のグループにグルーピングする場合、前記2以上のグループそれぞれに含まれるデータ項目の数を決定し、前記単位データ群における前記複数のデータ項目を、決定した前記数のデータ項目ごとにグルーピングすることで、前記2以上のグループにグルーピングするとしてもよい。
 また、例えば、前記第1線形和と前記第2線形和とを算出する線形式の係数はそれぞれ、前記2以上のグループにおけるグループの数を分母とする単位分数であるとしてもよい。
 また、例えば、前記プロセッサは、さらに、前記メモリを用いて、前記信号データ項目ごとに、算出した複数の前記第2マハラノビス距離同士を比較して、比較した結果を第2比較結果として出力し、前記第2比較結果に基づき、前記複数のデータ項目のうちどのデータ項目が異常になったかを解析する項目診断を行うとしてもよい。
 また、本開示の一形態に係る評価方法は、複数のデータ項目についての基準となるデータ群である単位データ群、及び前記複数のデータ項目についての評価対象となる1以上のデータである信号データ群を含むデータセットから、コンピュータがマハラノビス距離を用いて前記信号データ群の評価を行うための評価方法であって、前記単位データ群を、前記複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、前記2以上のグループにグルーピングされた前記単位データ群である前記2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し、算出した前記グループ別単位空間を用いて、対応する前記グループ別単位データ群の第1マハラノビス距離を算出し、算出した前記グループ別単位空間それぞれを用いて、対応するデータ項目における前記信号データ群の第2マハラノビス距離を算出し、算出した複数の前記第1マハラノビス距離の第1線形和を算出し、算出した複数の前記第2マハラノビス距離の第2線形和を算出し、算出した前記第1線形和と前記第2線形和とを比較して、比較結果を出力する。
 また、本開示の一形態に係るプログラムは、複数のデータ項目についての基準となるデータ群である単位データ群、及び前記複数のデータ項目についての評価対象となる1以上のデータである信号データ群を含むデータセットから、マハラノビス距離を用いて前記信号データ群の評価を行うための評価方法をコンピュータに実行させるためのプログラムであって、前記単位データ群を、前記複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、前記2以上のグループにグルーピングされた前記単位データ群である前記2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し、算出した前記グループ別単位空間を用いて、対応する前記グループ別単位データ群の第1マハラノビス距離を算出し、算出した前記グループ別単位空間それぞれを用いて、対応するデータ項目における前記信号データ群の第2マハラノビス距離を算出し、算出した複数の前記第1マハラノビス距離の第1線形和を算出し、算出した複数の前記第2マハラノビス距離の第2線形和を算出し、算出した前記第1線形和と前記第2線形和とを比較して、比較結果を出力する。
 以下で説明する実施の形態は、いずれも本開示の一具体例を示すものである。以下の実施の形態で示される数値、形状、構成要素、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また全ての実施の形態において、各々の内容を組み合わせることもできる。
 (実施の形態)
 以下では、図面を参照しながら、実施の形態における評価装置等の説明を行う。
 [評価装置1]
 図1は、本実施の形態における評価装置1の一例を示すブロック図である。
 評価装置1は、複数のデータ項目についての基準となるデータ群である単位データ群、及び複数のデータ項目についての評価対象となる1以上のデータ群である信号データ群を含むデータセットから、マハラノビス距離を用いて信号データ群の評価を行うためのものである。
 評価装置1は、CPUなどのプロセッサ(マイクロプロセッサ)、メモリ等を備えるコンピュータで実現される。より具体的には、評価装置1は、例えば図1に示すように、演算部10と、メモリ11と、入力部12と、出力部13とを備える。なお、評価装置1が入力部12及び出力部13を備えることは必須ではない。
 [入力部12]
 入力部12は、複数のデータ項目についての基準となるデータ群である単位データ群、及び複数のデータ項目についての評価対象となる1以上のデータ群である信号データ群を含むデータセットが入力される。入力部12には、単位データ群及び信号データ群が別々に入力されてもよい。
 [メモリ11]
 メモリ11は、記憶媒体の一例であり、例えば、ハードディスクドライブまたはソリッドステートドライブ等の書き換え可能な不揮発性のメモリで構成される。本実施の形態では、メモリ11は、入力部12に入力されたデータセットを記憶する。
 また、メモリ11は、後述する本実施におけるマハラノビス距離の算出方法のプログラム、マハラノビス距離の算出の際に用いる演算式、算出した相関係数、演算結果等が記憶されていてもよい。
 [演算部10]
 図2は、図1に示す演算部10の詳細機能構成の一例を示すブロック図である。
 演算部10は、例えば、CPUなどのプロセッサ(マイクロプロセッサ)であり、メモリ11などを用いて、信号データ群の評価を行うために、マハラノビス距離を用いた計算を実行する。本実施の形態では、図2に示すように単位空間算出部101と、MD値算出部102と、線形和算出部103とを備える。
 <単位空間算出部101>
 図3は、実施の形態における単位データ群と信号データ群との一例を示す図である。図4は、図3に示す単位データ群を2つのグループにグルーピングした場合の例を示す図である。
 単位空間算出部101は、単位データ群を、複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、2以上のグループにグルーピングされた単位データ群である2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出する。本実施の形態では、単位空間算出部101は、図2に示すように、相関係数算出部1011と、グルーピング部1012と、グループ別単位空間算出部1013とを備える。
 ≪相関係数算出部1011≫
 相関係数算出部1011は、単位データ群の複数のデータ項目のすべてにおける2つのデータ項目の間の関係を示す相関係数を算出する。これについて図3に示す例を用いて説明する。相関係数算出部1011は、図3に示すデータ項目1及び2、データ項目1及び3、データ項目1及び4、データ項目1及び5、データ項目2及び3、データ項目2及び4、データ項目2及び5、データ項目3及び4、データ項目3及び5、データ項目4及び5それぞれの単位データの相関係数を計算する。より詳細には、相関係数算出部1011は、データ項目1及び2におけるy11及びy12、y21及びy22、y31及びy32、y41及びy42、並びに、y51及びy52から相関係数を算出する。つまり、図3では、単位データ群は、単位データ1~単位データ5からなるため、2つのデータ項目の全ての組み合わせにおける単位データ1~単位データ5それぞれのデータから、相関係数が算出される。
 ここで、図3に示す単位データ群を一般化した場合に相関係数を算出する方法について説明する。単位データ群のデータ項目の数をk、単位データ群のサンプル数をnとすると、各データ項目の単位データはyij(i=1,2,・・・,n、j=1,2,・・・,k)と表すことができる。また、各データ項目j(j=1,2,・・・,k)における単位データyij(i=1,2,・・・,n)の平均値をm、標準偏差をρとする。この場合、相関係数算出部1011は、まず、(式1)を用いて、各データ項目の単位データの基準化を行う。これにより、単位データ群のマハラノビス距離(以下、MD(Mahalanobis’ Distance)とも記載)の平均値が1となる。
 Yij=(yij-m)/ρ  …(式1)
 ここで、i=1,2,…,n、j=1,2,…k
 相関係数算出部1011は、基準化を行った単位データ群を用いて、各々のデータ項目の間の相関、すなわちi列及びj列のデータの相関係数を、(式2)を用いて計算することができる。
Figure JPOXMLDOC01-appb-M000001
 したがって、相関係数算出部1011は、(式2)を用いて、単位データ群の複数のデータ項目すべての相関係数を計算すると、(式3)のような相関行列Rを作成することができる。
Figure JPOXMLDOC01-appb-M000002
 本実施の形態では、後述するMD値算出部102が、(式4)のような相関行列の逆行列R-1を計算するとして説明するが、相関係数算出部1011が逆行列R-1を計算してもよい。
Figure JPOXMLDOC01-appb-M000003
 なお、本実施の形態では、相関係数算出部1011は、単位データ群から、複数のデータ項目のすべてにおける2つのデータ項目の間の関係を示す相関係数を算出しなくてもよい。相関係数算出部1011は、グルーピングされたデータ項目のすべてにおけるデータ項目の間の相関係数を算出してもよい。これにより、単位データ群の複数のデータ項目のすべてにおける2つのデータ項目の間の相関係数を算出しなくてもよいので、計算量を削減することができる。また、逆行列を計算する際には、グルーピングされたデータ項目のすべてにおけるデータ項目の間の相関係数からなる相関行列からすればよいので、グルーピングしない場合と比較して計算量を削減することができる。
 ≪グルーピング部1012≫
 グルーピング部1012は、単位データ群を、複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングする。これについて図3及び図4に示す例を用いて説明すると、グルーピング部1012は、5つのデータ項目を、2つのグループにグルーピングする。より詳細には、データ項目1~5を、データ項目1及び2からなるグループ1とデータ項目3~5からなるグループ2との2つのグループにグルーピングする。図4に示す例では、予め決定したグループ数が2である場合に、グループ数が2となるようにグルーピングされた例が示されている。
 すなわち、グルーピング部1012が、単位データ群を2以上のグループにグルーピングする場合、そのグループの数が予め決定されていてもよい。このため、グルーピング部1012は、単位データ群における複数のデータ項目を、決定された数のグループそれぞれに振り分けることで、複数のデータ項目を2以上のグループにグルーピングしてもよい。
 なお、グルーピングの方法は、予め決定したグループ数とする方法に限らず、予め決定したデータ項目の数でグルーピングする方法であってもよいし、単位データ群におけるデータ項目間の相関係数を利用する方法であってもよい。
 すなわち、例えば、グルーピング部1012が、単位データ群を2以上のグループにグルーピングする場合、グルーピング部1012は、2以上のグループそれぞれに含まれるデータ項目の数を決定し、単位データ群における複数のデータ項目を、決定した数のデータ項目ごとにグルーピングすることで、2以上のグループにグルーピングしてもよい。
 また、例えば、グルーピング部1012は、相関係数算出部1011が算出した単位データ群におけるデータ項目間の相関係数を取得して、利用してもよい。より詳細には、グルーピング部1012が、単位データ群を2以上のグループにグルーピングする場合、グルーピング部1012は、単位データ群の複数のデータ項目のすべてにおける2つのデータ項目の間の関係を示す相関係数を取得する。グルーピング部1012は、取得した複数の相関係数を降順にソートし、2以上のグループそれぞれに含まれるデータ項目の数の上限を決定する。そして、グルーピング部1012は、降順に相関係数を示す2つのデータ項目を、決定した数の上限に従って、2以上のグループの1つに分類することで、2以上のグループにグルーピングすればよい。ここで、グルーピング部1012は、当該1つに分類する際、相関係数を示す2つのデータ項目のうちいずれかが、先に分類されたグループに含まれるデータ項目と重複し、かつ、先に分類されたグループに含まれるデータ項目の数が、決定した数の上限より小さい場合に、相関係数を示す2つのデータ項目を先に分類されたグループに分類すればよい。
 また、例えば、グルーピング部1012は、選択した2つのデータ項目の間の相関係数を相関係数算出部1011に算出させ、閾値を利用してグルーピングしてもよい。より詳細には、グルーピング部1012が、単位データ群を2以上のグループにグルーピングする場合、グルーピング部1012は、複数のデータ項目のうち選択した2つのデータ項目の間の関係を示す相関係数を取得し、取得した相関係数が閾値以上であるときに、選択した2つのデータ項目を、2以上のグループの1つに分類する。そして、グルーピング部1012は、このような分類を、複数のデータ項目のすべての組み合わせで行ってもよい。なお、グルーピング部1012は、このような分類をすべての組み合わせで行った際、当該2以上のグループの1つに分類されなかった1以上のデータ項目を、すべての組み合わせで行われた際に分類されなかった、2以上のグループの1つに分類すればよい。これらのように、グルーピング部1012は、相関係数が高いデータ項目をグルーピングすることで、単位データ群を2以上のグループにグルーピングしてもよい。
 ≪グループ別単位空間算出部1013≫
 グループ別単位空間算出部1013は、2以上のグループにグルーピングされた単位データ群である2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出する。これについて図4に示す例を用いて説明すると、グループ別単位空間算出部1013は、グルーピング部1012によりグルーピングされたグループ1、2に含まれる単位データを、グループ1、2におけるグループ別単位空間と決定する。より詳細には、グループ別単位空間算出部1013は、グループ1のデータ項目1及び2についてのy11及びy12、y21及びy22、y31及びy32、y41及びy42、並びに、y51及びy52をグループ1のグループ別単位空間と決定する。また、グループ別単位空間算出部1013は、グループ2のデータ項目3~5についてのy13~y15、y23~y25、y33~y35、y43~y45、並びに、y53~y55をグループ2のグループ別単位空間と決定する。つまり、グループ別単位空間算出部1013は、グループ1に属するすべての単位データで形成された単位空間と、グループ2に属するすべての単位データで形成された単位空間とを、グループ別単位空間に決定する。
 なお、グループ別単位空間算出部1013は、決定したグループ別単位空間それぞれにおける各データ項目を基準化し、基準化したグループ別単位空間それぞれの相関係数を、相関係数算出部1011に算出させて取得してもよい。グループ別単位空間それぞれにおける各データ項目を基準化し相関係数を算出する方法は、上述した(式1)、(式2)を用いた方法と同様のため説明を省略する。
 <MD値算出部102>
 MD値算出部102は、算出したグループ別単位空間を用いて、対応するグループ別単位データ群の第1マハラノビス距離を算出する。また、MD値算出部102は、算出したグループ別単位空間それぞれを用いて、対応するデータ項目における信号データ群の第2マハラノビス距離を算出する。本実施の形態では、MD値算出部102は、図2に示すように、グループ別単位データ群MD算出部1021と、グループ別信号データ群MD算出部1022とを備える。
 ≪グループ別単位データ群MD算出部1021≫
 図5は、実施の形態におけるグループ別単位空間を用いた単位データ群のマハラノビス距離の一例を示す図である。図5には、図4に示すグループ1、2から決定されたグループ別単位空間を用いて算出された、図3に示す単位データ群のマハラノビス距離の例が示されている。また、図5では、グループ1のグループ別単位空間を用いて算出されるマハラノビス距離がMD1と示されている。同様に、グループ2のグループ別単位空間を用いて算出されるマハラノビス距離がMD2と示されている。
 グループ別単位データ群MD算出部1021は、単位空間算出部101が算出したグループ別単位空間を用いて、対応するグループ別単位データ群の第1マハラノビス距離を算出する。これについて図4及び図5に示す例を用いて説明する。グループ別単位データ群MD算出部1021は、図4に示すグループ1、2に属するすべての単位データで形成されるグループ別単位空間を用いて、当該グループ1、2に属する単位データそれぞれのマハラノビス距離を算出する。より詳細には、グループ別単位データ群MD算出部1021は、図4に示すグループ1に属するすべての単位データで形成されるグループ別単位空間を用いて、単位データ1~5それぞれのマハラノビス距離であるMDr11~MDr15を算出する。ここで、グループ1に属するすべての単位データは、y11、y12、y21、y22、y31、y32、y41、y42、y51及びy52である。同様に、グループ別単位データ群MD算出部1021は、図4に示すグループ2に属するすべての単位データで形成されるグループ別単位空間を用いて、単位データ1~5それぞれのマハラノビス距離であるMDr21~MDr25を算出する。ここで、グループ1に属するすべての単位データは、y13~y15、y23~y25、y33~y35、y43~y45、y53~y55である。
 本実施の形態では、グループ別単位データ群MD算出部1021は、グループ別単位空間それぞれの相関係数からなる相関行列Rの逆行列R-1を算出する。なお、逆行列R-1を算出する方法は、上述した(式4)を用いた方法と同様のため説明を省略する。次に、グループ別単位データ群MD算出部1021は、グループ別単位データ群を構成する単位データyijを列ベクトルで表現したyを、グループ別単位データ群を構成する単位データyijの平均値m及び標準偏差ρを用いて、(式1)のように基準化した行列Yを算出する。そして、グループ別単位データ群MD算出部1021は、列ベクトルY(j=1,2,・・・,k)とその転置ベクトルY とを用いて、(式5)に示すように演算することでグループ別単位データ群の第1マハラノビス距離すなわちMDを算出する。ただし、列ベクトルY(j=1,2,・・・,k)は、Yij(i=1,2,・・・,n)を要素とする列ベクトルを表す。なお、(式5)において、kは、グループ別単位データ群のデータ項目の数である。このようにして、グループ別単位データ群MD算出部1021は、グループ別単位データ群における、そのグループ別単位空間の中心からの多次元の距離、第1マハラノビス距離を算出することができる。
 MD=Y-1 /k・・・(式5)
 ≪グループ別信号データ群MD算出部1022≫
 図6は、実施の形態におけるグループ別単位空間を用いた信号データ群のマハラノビス距離の一例を示す図である。図6には、図4に示すグループ1、2から決定されたグループ別単位空間を用いて算出された、図3に示す信号データ群のマハラノビス距離の例が示されている。なお、図5と同様の要素には同一の名称を付しており、詳細な説明は省略する。
 グループ別信号データ群MD算出部1022は、単位空間算出部101が算出したグループ別単位空間それぞれを用いて、対応するデータ項目における信号データ群の第2マハラノビス距離を算出する。これについて図4及び図6に示す例を用いて説明する。グループ別信号データ群MD算出部1022は、図4に示すグループ1、2に属するすべての単位データで形成されるグループ別単位空間を用いて、当該グループ1、2に属するデータ項目についての信号データそれぞれのマハラノビス距離を算出する。
 より詳細には、グループ別信号データ群MD算出部1022は、図4に示すグループ1に属するすべての単位データで形成されるグループ別単位空間を用いて、信号データ1、2それぞれのマハラノビス距離であるMDs11、MDs12を算出する。同様に、グループ別信号データ群MD算出部1022は、図4に示すグループ2に属するすべての単位データで形成されるグループ別単位空間を用いて、信号データ1、2それぞれのマハラノビス距離であるMDs21、MDs22を算出する。
 本実施の形態では、グループ別信号データ群MD算出部1022は、グループ別単位データ群MD算出部1021が算出したグループ別単位空間それぞれに対応する逆行列R-1を用いて、信号データ群のマハラノビス距離を算出する。より詳細には、まず、グループ別信号データ群MD算出部1022は、信号データ群を構成するデータを列ベクトルで表現し、対応するグループ別単位空間で用いた平均値m及び標準偏差ρを用いて、基準化した行列を算出する。そして、グループ別信号データ群MD算出部1022は、算出した行列中の列ベクトルとその転置ベクトルと、グループ別単位空間それぞれに対応する逆行列R-1とを用いて、(式5)に示すように演算することで信号データ群の第2マハラノビス距離すなわちMDを算出する。このように、グループ別信号データ群MD算出部1022は、グループ別単位空間に対応する信号データ群における、当該グループ別単位空間の中心からの多次元の距離から、第2マハラノビス距離を算出することができる。
 <線形和算出部103>
 線形和算出部103は、グループ別単位データ群MD算出部1021が算出した複数の第1マハラノビス距離の第1線形和を算出する。また、線形和算出部103は、グループ別信号データ群MD算出部1022が算出した複数の第2マハラノビス距離の第2線形和を算出する。ここで、第1線形和と第2線形和とを算出する線形式の係数はそれぞれ、当該2以上のグループにおけるグループの数を分母とする単位分数である。
 本実施の形態では、線形和算出部103は、グループ別単位データ群MD算出部1021が算出した単位データ群それぞれの複数の第1マハラノビス距離の第1線形和を算出する。これについて図5に示す例を用いて説明すると、線形和算出部103は、単位データ1の複数の第1マハラノビス距離であるMDr11とMDr21との線形和を算出する。より詳細には、線形和算出部103は、(式6)に示すように、線形式の項が2つであるので線形式の項それぞれの係数を1/2としてMDr11とMDr21との線形和を算出することで、単位データ1の第1線形和を算出する。
 信号データ1の第1線形和=1/2MDr11+1/2MDr21…(式6)
 同様に、線形和算出部103は、線形式の項それぞれの係数を1/2として、単位データ2の複数の第1マハラノビス距離であるMDr12とMDr22との線形和を算出し、単位データ3の複数の第1マハラノビス距離であるMDr13とMDr23との線形和を算出する。線形和算出部103は、線形式の項それぞれの係数を1/2として、単位データ4の複数の第1マハラノビス距離であるMDr14とMDr24との線形和を算出し、単位データ5の複数の第1マハラノビス距離であるMDr15とMDr25との線形和を算出する。
 また、線形和算出部103は、グループ別信号データ群MD算出部1022が算出した信号データ群それぞれの複数の第2マハラノビス距離の第2線形和を算出する。これについて図6に示す例を用いて説明すると、線形和算出部103は、信号データ1の複数の第2マハラノビス距離であるMDs11とMDs21との線形和を算出する。より詳細には、線形和算出部103は、(式7)に示すように、線形式の項それぞれの係数を1/2としてMDs11とMDs21との線形和を算出することで、信号データ1の第2線形和を算出する。
 信号データ1の第2線形和=1/2MDs11+1/2MDs21…(式7)
 同様に、線形和算出部103は、線形式の項それぞれの係数を1/2として、信号データ2の複数の第2マハラノビス距離であるMDs12とMDs22との線形和を算出することで、信号データ2の第2線形和を算出する。
 このように、線形和算出部103は、算出されたグルーピングされたグループ数を分母とする単位分数を係数として、グループ数分のマハラノビス距離の第2線形和を算出する。
 なお、第1線形和及び第2線形和を算出する際の線形式の項におけるそれぞれの係数は、グループ数を分母とする単位分数など重み付けしないものである場合に限らず、相関係数の平均値などで重み付けしたものでもよい。
 [出力部13]
 出力部13は、線形和算出部103が算出した第1線形和と第2線形和とを比較して、比較した結果を第1比較結果として出力する。出力部13は、信号データ群ごとに、算出した複数の第2マハラノビス距離同士を比較して、比較した結果を第2比較結果として出力してもよい。例えば、第2比較結果により、ある信号データ群の第2線形和が、すべての単位データ群の第1線形和よりも値がかなり大きく、閾値以上であることが判定できれば、当該信号データ群が異常であると判定できる。
 また、出力部13は、さらに、第2比較結果に基づき、複数のデータ項目のうちどのデータ項目が異常になったかを解析する項目診断を行い、その結果を出力してもよい。例えば、出力部13は、項目診断の結果、ある信号データ群のデータ項目が異常になったことを解析した場合、異常となったデータ項目を通知する警告情報を出力してもよい。
 [評価装置1の動作]
 上述のように構成された評価装置1の動作の一例について以下説明する。
 図7Aは、本実施の形態における評価装置1の全体動作を示すフローチャートである。
 評価装置1は、CPUとメモリとを用いて、以下のステップS11~ステップS17の処理を行う。より具体的には、まず、評価装置1は、単位データ群を、複数のデータ項目のうち少なくとも1以上のデータ項目を含む、2以上のグループにグルーピングする(S11)。次に、評価装置1は、グルーピングされた単位データ群である2以上のグループ別単位データ群それぞれにおける単位空間を、グループ別単位空間として算出する(S12)。次に、評価装置1は、算出したグループ別単位空間を用いて、対応するグループ別単位データ群の第1マハラノビス距離を算出する(S13)。次に、評価装置1は、算出したグループ別単位空間それぞれを用いて、対応するデータ項目における信号データ群の第2マハラノビス距離を算出する(S14)。次に、評価装置1は、ステップS13において算出した複数の第1マハラノビス距離の第1線形和を算出する(S15)。ここで、評価装置1は、ステップS13において算出した複数の第1マハラノビス距離を用いて、グループ別単位データ群それぞれにおける第1線形和を算出する。次に、評価装置1は、ステップS14において算出した複数の第2マハラノビス距離の第1線形和を算出する(S16)。ここで、評価装置1は、ステップS14において算出した複数の第2マハラノビス距離を用いて、グループ別単位空間に対応する信号データ群それぞれにおける第2線形和を算出する。最後に、評価装置1は、ステップS15において算出された第1線形和とステップS16において算出された第2線形和とを比較して、その比較結果を出力する(S17)。
 以下、ステップS11の詳細動作の一例について図7Bを用いて説明する。
 図7Bは、図7Aに示すステップS11の詳細動作の一例を示すフローチャートである。図7Bには、相関係数が高いデータ項目をグルーピングすることで、単位データ群を2以上のグループにグルーピングする場合の詳細動作が示されている。
 すなわち、ステップS11において、まず、評価装置1は、単位データ群のデータ項目間における相関係数を取得する(S111)。評価装置1は、単位データ群のデータ項目間それぞれの2つの単位データから算出することで、単位データ群のデータ項目間における相関係数を取得する。続いて、評価装置1は、取得した相関係数を降順にソートし(S112)、最も高い値の相関係数を示す2つのデータ項目を1つのグループとして形成する(S113)。
 続いて、評価装置1は、次に高い値を示す相関係数を示す2つのデータ項目を取得し(S114)、取得した2つのデータ項目の両方とも、形成中のグループを構成するデータ項目と重複するか否かを判定する(S115)。
 ステップS115において重複しない場合(S115でno)、評価装置1は、取得した2つのデータ項目のいずれかが、形成中のグループを構成するデータ項目と重複するか否かを判定する(S116)。
 ステップS116において重複しない場合(S116でno)、データ項目の両方とも完成したグループを構成するデータ項目と重複しないときには(S117でno)、評価装置1は、重複しないその2つのデータ項目を別のグループとして形成する(S118)。なお、ステップS115において、完成したグループを構成するデータ項目と重複するときには(S117でyes)、評価装置1は、何もせずステップS116に戻る。
 一方、ステップS116において重複する場合(S116でyes)、評価装置1は、当該2つのデータ項目を重複するそのグループに加え(S119)、そのグループのデータ項目の数が上限になったかどうかを確認する(S120)。
 ステップS120において、上限になったことを確認した場合(S120でyes)、評価装置1は、そのグループが完成したものとして取り扱い(S121)、他に形成中のグループがあるかどうかを確認する(S122)。
 ステップS122において、形成中のグループが他にない場合(S122でno)、残りのすべてのデータ項目を1つのグループとして形成し(S123)、処理を終了する。
 なお、ステップS115において、重複する場合(S115でyes)、ステップS117において、データ項目の少なくとも一方が完成したグループを構成するデータ項目と重複するときには(S117でyes)には、ステップS114に戻り処理を繰り返す。また、ステップS120において、上限になっていない場合(S120でno)、及び、ステップS122において、形成中のグループが他にある場合(S122でyes)には、ステップS114に戻り処理を繰り返す。
 このようにして、評価装置1は、単位データ群の複数のデータ項目を2以上のグループにグルーピングすることで、単位データ群を2以上のグループにグルーピングする。
 [効果等]
 以上のようにして、評価装置1は、単位データ群の複数のデータ項目をグルーピングすることで、単位データ群を複数のグループに分割し、信号データ群のマハラノビス距離を当該グループ毎に算出し、算出したマハラノビス距離の線形和を算出する。そして、算出した線形和で信号データ群を評価する。これにより、評価装置1は、データ項目の数が多くても逆行列計算などマハラノビス距離を行うための計算量を削減できるので、計算時間を短縮することができる。例えば、グルーピングしない場合には、マハラノビス距離を計算するための一連の計算量は、項目数の3乗に比例した計算量となる。一方、本実施の形態のようにグルーピングする場合には、グルーピングしない場合の計算量からグルーピング数の2乗を除した計算量となり、計算量を削減できる。
 なお、ここではグループ毎のデータ数に上限を設ける場合について説明したが、データ数に上限を設けない場合や、グループ数に上限を設ける場合なども、同様の効果を得られる。
 ここで、MT法の手順と、MT法を用いてできることとを示す全体像について説明する。
 図8は、MT法の全体像を説明するための概念図である。
 まず、記憶装置等に、生産設備データなどの取得データが格納されているとする。なお、生産設備データとしては例えば一定間隔で離間した設備の位置毎の時系列な温度データなどの物理データでもよいし、設備ごとの生産物についての物理データでもよいし、物理データを特徴量化したスカラーのデータであってもよい。
 MT法では、まず、取得データから、特徴量1~kを抽出し、例えば、テーブル型に特徴量1~kとそのデータとを配列する。特徴量としては、物理データの微分特性値、積分特性値、波形特徴値、最大値、最小値などが挙げられる。例えば、温度などの生産設備データから、波形データを抽出し、波形データをデータ項目についてテーブル型に配列する。
 次に、テーブル型に配列したデータのうち、OKデータすなわち正常であるとみなす単位データ1~mを決定し、単位空間を生成する。このとき、生成した単位空間の相関行列と当該相関行列の逆行列などを計算しておく。
 次に、取得データのうち、OKかNGかわからないデータすなわち正常であるかどうかわからない信号データm+1~nについて、単位空間を用いてマハラノビス距離(MD値)を計算する。そして、閾値を決定し、計算したMD値とその閾値とを用いて、信号データm+1~nが正常か否かを判定する。
 なお、信号データm+1~nがNGデータすなわち正常でないと判定された場合、信号データm+1~nについて項目診断し、項目毎の要因の影響度を解析してもよい。
 本実施の形態では、上述したが、図8に示す単位空間を、抽出した特徴量1~kすべてではなく、グルーピングした特徴量1~kごとすなわちグループ別の単位データごとに、グループ別単位空間として生成する。そして、信号データm+1~nのMD値及び項目診断を、グループ別単位空間を用いて、グルーピングした特徴量1~kごとの信号データm+1~nに対して行う。
 (実施例1)
 上記の実施の形態における評価装置1が行う評価方法の具体的態様の一例について、実施例1として説明する。
 図9は、実施例1における波形データの一例を示す図である。図10は、図9に示す波形データをグラフに表した図である。図9に示す波形データは、メモリ11に格納されたデータセットから抽出され、単位空間を形成するために用いられる基準となるデータ群である単位データ群(U1~U26)と、評価対象となるデータ群である信号データ群(S1~S4)とで構成されている。図9に示す波形データは、WAVE1~WAVE12と示されるデータ項目ごとにテーブル型に配列されている。なお、図9でハッチングされている欄は、図10に示す単位データ群(U1~U26)から外れている信号データ群の値を示している。図10に示すように、信号データS1は、単位データ群(U1~U26)と比較して、複数のデータ項目(WAVE1~WAVE12)における値の変化すなわち形状は似通っているが、全体的に値が小さい。信号データS2は、単位データ群(U1~U26)と比較して、複数のデータ項目(WAVE1~WAVE12)における値及び値の変化は似通っているが、WAVE7の値だけ外れている。信号データS3は、単位データ群(U1~U26)と比較して、複数のデータ項目(WAVE1~WAVE12)における値及び値の変化は似通っているが、WAVE1、2、3の値が外れている。信号データS4は、単位データ群(U1~U26)と比較して、複数のデータ項目(WAVE1~WAVE12)における値及び値の変化は似通っているが、WAVE10及びWAVE11の値が右下がりとなっている。
 [MD値の算出]
 図11Aは、図9に示す波形データに対するMT法のMD値と本手法のMD値とを示す図である。本手法のMD値は、上記の実施の形態における評価装置1が行い、複数のデータ項目をグルーピングして、複数のグループに分割した単位データ群から形成したグループ別単位空間を用いて算出した、複数のマハラノビス距離の線形和である。本実施例では、複数のデータ項目(WAVE1~WAVE12)を4つずつ(WAVE1~WAVE4、WAVE5~WAVE8、WAVE9~WAVE12)、3グループに単位データ群を分割した。また、3グループに分割した単位データ群から形成したグループ別単位空間を用いて、単位データ(U1~U26)ごとのMD値を算出した。図11Aには、グループ別単位空間を用いて算出した、単位データ(U1~U26)ごとのMD値がグループ別MD値(MD1_1、MD1_2、MD1_3)として示されている。
 なお、図11Aには、比較例として、図9に示す波形データに対するマルチMT法のMD値も示されている。マルチMT法のMD値は、複数のデータ項目をグルーピングして、それぞれのグループでマハラノビス距離を算出し、算出した複数のマハラノビス距離を入力として算出した1つのマハラノビス距離である。マルチMT法では、マハラノビス距離の算出を2階層以上行う必要があるので、グルーピングしないMT法のMD値、及び、グルーピングするが1階層のマハラノビス距離の算出を行う本手法のMD値よりも計算量が多くなる。つまり、本手法のMD値とマルチMT法とは、いずれもグルーピングという手法を用いるが、本手法のMD値に必要な計算量はマルチMT法に必要な計算量よりも少ない。
 図11Bは、図11Aから抜粋した、MT法のMD値と本手法のMD値とマルチMT法のMD値とを示す図である。図12は、図11Aから抜粋した、MT法のMD値と本手法のMD値とマルチMT法のMD値とのヒストグラムを示す図である。図12の(a)には図11Aから抜粋したMT法のMD値のヒストグラムが示され、図12の(b)には図11Aから抜粋したマルチMT法のMD値のヒストグラムが示され、図12の(c)には図11Aから抜粋した本手法のMD値のヒストグラムが示されている。
 図12からわかるように、信号データS1~S4について、本手法のMD値とMT法のMD値とが同じ傾向を示しているのがわかる。これにより、本手法のMD値をMT法のMD値の代わりに用いることで、MT法のMD値と比較して計算量を削減できるだけでなく、MT法のMD値を用いる場合と同じ判定ができるのがわかる。
 なお、信号データS1~S4についてマルチMT法のMD値は、3グループに分割した単位データ群(グループ別単位データ群)のMD値に対して大きすぎる。このため、正常または異常であるかの判定で信号データS1をグレーゾーン扱いにできず、正しい判定が難しいというのがわかる。
 [項目診断]
 図13Aは、図11Aに示す信号データ群の各データ項目に対してMT法を用いて項目診断を行うための計算結果を示す図である。例えばMT法のMD値を用いて異常と判定された信号データS3でのWAVE1のデータ項目では、WAVE1のデータ項目の影響を、直交表を用いて計算した値が記入されている。他のデータ項目に記入されている値も同様である。なお、これらの値を記入するために、WAVE2~WAVE12の複数のデータ項目における相関行列を算出し、算出した相関行列の逆行列を用いている。また、図13Aには、データ項目に記入されている値と比較できるように、信号データそれぞれに対するMT法のMD値も示されている。
 図13Bは、図11Aに示す信号データ群のグループ別MD値に対してマルチMT法を用いて項目診断を行うための計算結果を示す図である。例えばマルチMT法のMD値を用いて異常と判定された信号データS3でのMD1_1の項目では、上記と同様にして、直交表を用いて、MD1_1の影響を計算した値が記入されている。他の項目に記入されている値も同様である。また、図13Aには、項目に記入されている値と比較できるように、信号データそれぞれに対するマルチMT法のMD値も示されている。
 図13Cは、図11Aに示す信号データ群の各データ項目に対して本手法を用いて項目診断を行うために用いた表を示す図である。図13Cには、図11Aに示すグループ別MD値(MD1_1、MD1_2、MD1_3)が抜粋された表が示されている。
 図14は、図9に示す信号データS1に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。図14の(a)には信号データS1に対するMT法による項目診断を行うためのグラフが示され、図14の(b)には信号データS1に対するマルチMT法による項目診断を行うためのグラフが示されている。また、図14の(c)には信号データS1に対する本手法による項目診断を行うためのグラフが示されている。同様に、図15は、図9に示す信号データS2に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。図16は、図9に示す信号データS3に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。図17は、図9に示す信号データS4に対するMT法、マルチMT法及び本手法による項目診断を行うためのグラフを示す図である。図15~図17の(a)には信号データS2~S4に対するMT法による項目診断を行うためのグラフが示されている。同様に、図15~図17の(b)には信号データS2~S4に対するマルチMT法による項目診断を行うためのグラフが示され、図15~図17の(c)には信号データS2~S4に対する本MT法による項目診断を行うためのグラフが示されている。
 図14~図17からわかるように、信号データS1~S4について本手法の項目診断を行うためのグラフとマルチMT法の項目診断を行うためのグラフとが同じ傾向を示しているのがわかる。つまり、これにより、本手法の項目診断とマルチMT法の項目診断とが同等の性能なのがわかるので、本手法の項目診断をマルチMT法の項目診断の代わりに用いることができる。これにより、信号データ群のグループ別MD値をそのまま用いることができるので、マルチMT法の項目診断で行う相関行列及び逆行列の算出が不要となり、計算量を削減できる。
 例えば、信号データS2の項目診断については、図15の(a)から、MT法の項目診断を行うためのグラフでは、WAVE7のデータ項目のMD値が突出しており、WAVE7のデータ項目が、信号データS2が異常と判定された原因であることがわかる。図15の(c)から、本手法の項目診断を行うためのグラフでは、WAVE7を含む4つのデータ項目(WAVE1~WAVE12)からなるMD1_2のグループ別MD値が突出しており、MD1_2が、信号データS2が異常と判定された原因であることがわかる。そして、本手法の項目診断より異常と判定されたMD1_2を構成する4つのデータ項目(WAVE1~WAVE12)についてさらにMT法の項目診断を行うことで、WAVE7のデータ項目が、信号データS2が異常と判定された原因であることがわかる。他の信号データS3、S4の項目診断を行うためのグラフについても、説明は省略するが同様のことがわかる。
 このように、本手法の項目診断を行い、異常と判定されたグループを構成するデータ項目についてさらにMT法の項目診断を行う。これにより、すべてのデータ項目について行うMT法の項目診断と比較して、計算量を削減できるだけでなく、すべてのデータ項目について行うMT法の項目診断と同じ解析ができるのがわかる。
 以上のように、本手法によれば、上記の実施の形態における評価装置1が項目診断を行う場合でも、逆行列計算などマハラノビス距離を行うための計算量を削減できるので、計算時間を短縮することができる。
 (実施例2)
 実施例2では、単位データ群におけるデータ項目間の相関係数を利用して単位データ群を2以上のグループにグルーピングする方法の一例について説明する。
 図18は、実施例2における相関係数表の一例を示す図である。図18には、図9に示す波形データのデータ項目間の相関係数が示されている。図18に示す相関係数は、実施の形態における評価装置1により算出される。
 図19は、図18に示す相関係数を、2つのデータ項目の組み合わせでリスト化した表を示す図である。このリスト化は、実施の形態における評価装置1により行われてもよい。図19の表における組み合わせの数字は、図18の1行目のデータ項目の番号すなわちWave1~Wave12のいずれかと図18の1列目のデータ項目の番号すなわちWave1~Wave12のいずれかとの組み合わせを示している。例えば、組み合わせ1-2には、図18の1行目のWave1と図18の2列目のWave2との相関係数0.922252が示されている。図19に示す相関係数は、実施の形態における評価装置1により算出される。
 図20は、図19に示す相関係数が降順にソートされたときの相関係数及びその2つのデータ項目の組み合わせと、3つのグループにグルーピングした手順とを示す図である。
 本実施例では、図9に示す波形データの12個のデータ項目を4つずつ、3つのグループに分けることが予め決定されているとする。この場合、最も高い値の相関係数0.934755を示す組み合わせ2-3を1つの目のグループであるグループ1とする。次に高い値の相関係数0.929843を示す組み合わせ6-8は、グループ1に含まれる組み合わせの数字すなわちデータ項目と重複しないので、組み合わせ6-8を別のグループであるグループ2とする。
 次に高い値の相関係数0.922252を示す組み合わせ1-2は、グループ1に含まれる組み合わせの数字の2と重複するので、組み合わせ1-2をグループ1に加える。同様に、次に高い値の相関係数0.916117を示す組み合わせ3-4は、グループ1に含まれる組み合わせの数字の3と重複するので、組み合わせ3-4をグループ1に加える。これにより、グループ1に含まれる組み合わせは1-2-3-4となり、データ項目の数が上限となったため、グループ1は完成したものとして取り扱う。
 次に高い値の相関係数0.901614を示す組み合わせ2-4は、グループ1に含まれているので、なにもしない。なお、組み合わせ2-4をグループ1に加えてもグループ1に含まれるデータ項目は変化しないので、組み合わせ2-4をグループ1に加えるとしてもよい。次に、高い値の相関係数0.896364を示す組み合わせ1-3も、グループ1に含まれているので、なにもしない。
 次に高い値の相関係数0.895188を示す組み合わせ6-7は、グループ2に含まれる組み合わせの数字の6と重複するので、組み合わせ6-7をグループ2に加える。一方、この次に、高い値の相関係数0.893529を示す組み合わせ4-5は、グループ1に含まれる組み合わせの数字の4と重複するが、グループ1のデータ数は上限となり完成しているので、なにもしない。
 また、次に高い値の相関係数0.893529を示す組み合わせ5-6は、グループ2に含まれる組み合わせの数字の6と重複するので、組み合わせ5-6をグループ2に加える。これにより、グループ2に含まれる組み合わせは5-6-7-8となり、データ項目の数が上限となったため、グループ2は完成したものとして取り扱う。
 そして、形成中のグループが他にないため、残りの組み合わせ9-10-11-12を1つのグループであるグループ3とする。
 このようにして、評価装置1は、単位データ群におけるデータ項目間の相関係数を利用して単位データ群を2以上のグループにグルーピングすることができる。
 なお、本実施例ではデータ項目数、グループ数をあらかじめ決めておいたが、データ数のみ決めたり、グループ数のみ決めたりする場合にも、それに応じたステップでグルーピングを行うことが可能である。
 (他の実施態様の可能性)
 以上、実施の形態において本開示の評価装置、評価方法及びプログラムについて説明したが、各処理が実施される主体や装置に関しては特に限定しない。ローカルに配置された特定の装置内に組み込まれたプロセッサなど(以下に説明)によって処理されてもよい。またローカルの装置と異なる場所に配置されているクラウドサーバなどによって処理されてもよい。
 なお、本開示は、上記実施の形態に限定されるものではない。例えば、本明細書において記載した構成要素を任意に組み合わせて、また、構成要素のいくつかを除外して実現される別の実施の形態を本開示の実施の形態としてもよい。また、上記実施の形態に対して本開示の主旨、すなわち、請求の範囲に記載される文言が示す意味を逸脱しない範囲で当業者が思いつく各種変形を施して得られる変形例も本開示に含まれる。
 また、本開示は、さらに、以下のような場合も含まれる。
 (1)上記の装置は、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。前記RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
 (2)上記の装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
 (3)上記の装置を構成する構成要素の一部または全部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。前記ICカードまたは前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。前記ICカードまたは前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ICカードまたは前記モジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。
 (4)また、本開示は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。
 (5)また、本開示は、前記コンピュータプログラムまたは前記デジタル信号をコンピュータで読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD-ROM、MO、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray(登録商標) Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。
 また、本開示は、前記コンピュータプログラムまたは前記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。
 また、本開示は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。
 また、前記プログラムまたは前記デジタル信号を前記記録媒体に記録して移送することにより、または前記プログラムまたは前記デジタル信号を、前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
 本開示は、マハラノビス距離を用いた評価装置、評価方法及びプログラムに利用でき、特に生産設備などの異常を判定するために用いられる評価装置、評価方法及びプログラムに利用できる。
 1  評価装置
 10  演算部
 11  メモリ
 12  入力部
 13  出力部
 101  単位空間算出部
 102  MD値算出部
 103  線形和算出部
 1011  相関係数算出部
 1012  グルーピング部
 1013  グループ別単位空間算出部
 1021  グループ別単位データ群MD算出部
 1022  信号データ群MD算出部

Claims (10)

  1.  複数のデータ項目についての基準となるデータ群である単位データ群、及び前記複数のデータ項目についての評価対象となる1以上のデータ群である信号データ群を含むデータセットから、マハラノビス距離を用いて前記信号データ群の評価を行うための評価装置であって、
     プロセッサと、
     メモリと、を備え、
     前記プロセッサは、前記メモリを用いて、
     前記単位データ群を、前記複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、
     前記2以上のグループにグルーピングされた前記単位データ群である前記2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し、
     算出した前記グループ別単位空間を用いて、対応する前記グループ別単位データ群の第1マハラノビス距離を算出し、
     算出した前記グループ別単位空間それぞれを用いて、対応するデータ項目における前記信号データ群の第2マハラノビス距離を算出し、
     算出した複数の前記第1マハラノビス距離の第1線形和を算出し、
     算出した複数の前記第2マハラノビス距離の第2線形和を算出し、
     算出した前記第1線形和と前記第2線形和とを比較して、比較した結果を第1比較結果として出力する、
     評価装置。
  2.  前記単位データ群を前記2以上のグループにグルーピングする場合、
     前記単位データ群の前記複数のデータ項目のすべてにおける2つのデータ項目の間の関係を示す相関係数を取得し、
     取得した複数の前記相関係数を降順にソートし、
     前記2以上のグループそれぞれに含まれるデータ項目の数の上限を決定し、
     降順に相関係数を示す2つのデータ項目を、決定した前記数の上限に従って、前記2以上のグループの1つに分類することで、前記2以上のグループにグルーピングする、
     請求項1に記載の評価装置。
  3.  前記1つに分類する際、前記相関係数を示す2つのデータ項目のうち少なくとも一方が、先に分類されたグループに含まれるデータ項目と重複し、かつ、前記先に分類されたグループに含まれるデータ項目の数が、決定した前記数の上限より小さい場合に、前記相関係数を示す2つのデータ項目を前記先に分類されたグループに分類する、
     請求項2に記載の評価装置。
  4.  前記単位データ群を前記2以上のグループにグルーピングする場合、
     前記複数のデータ項目のうち選択した2つのデータ項目の間の関係を示す相関係数を取得し、取得した前記相関係数が閾値以上であるときに、選択した前記2つのデータ項目を、前記2以上のグループの1つに分類することを、前記複数のデータ項目のすべての組み合わせで行い、
     前記すべての組み合わせで行われた際、前記2以上のグループの1つに分類されなかった1以上のデータ項目を、前記すべての組み合わせで行われた際に分類されなかった、前記2以上のグループの1つに分類することで、前記単位データ群を前記2以上のグループにグルーピングする、
     請求項1に記載の評価装置。
  5.  前記単位データ群を前記2以上のグループにグルーピングする場合、
     前記2以上のグループにおけるグループの数を決定し、
     前記単位データ群における前記複数のデータ項目を、決定した前記数のグループそれぞれに振り分けることで、前記2以上のグループにグルーピングする、
     請求項1に記載の評価装置。
  6.  前記単位データ群を前記2以上のグループにグルーピングする場合、
     前記2以上のグループそれぞれに含まれるデータ項目の数を決定し、
     前記単位データ群における前記複数のデータ項目を、決定した前記数のデータ項目ごとにグルーピングすることで、前記2以上のグループにグルーピングする、
     請求項1に記載の評価装置。
  7.  前記第1線形和と前記第2線形和とを算出する線形式の係数はそれぞれ、前記2以上のグループにおけるグループの数を分母とする単位分数である、
     請求項1~6のいずれか1項に記載の評価装置。
  8.  前記プロセッサは、さらに、前記メモリを用いて、
     前記信号データ項目ごとに、算出した複数の前記第2マハラノビス距離同士を比較して、比較した結果を第2比較結果として出力し、
     前記第2比較結果に基づき、前記複数のデータ項目のうちどのデータ項目が異常になったかを解析する項目診断を行う、
     請求項1~7のいずれか1項に記載の評価装置。
  9.  複数のデータ項目についての基準となるデータ群である単位データ群、及び前記複数のデータ項目についての評価対象となる1以上のデータである信号データ群を含むデータセットから、コンピュータがマハラノビス距離を用いて前記信号データ群の評価を行うための評価方法であって、
     前記単位データ群を、前記複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、
     前記2以上のグループにグルーピングされた前記単位データ群である前記2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し、
     算出した前記グループ別単位空間を用いて、対応する前記グループ別単位データ群の第1マハラノビス距離を算出し、
     算出した前記グループ別単位空間それぞれを用いて、対応するデータ項目における前記信号データ群の第2マハラノビス距離を算出し、
     算出した複数の前記第1マハラノビス距離の第1線形和を算出し、
     算出した複数の前記第2マハラノビス距離の第2線形和を算出し、
     算出した前記第1線形和と前記第2線形和とを比較して、比較結果を出力する、
     評価方法。
  10.  複数のデータ項目についての基準となるデータ群である単位データ群、及び前記複数のデータ項目についての評価対象となる1以上のデータである信号データ群を含むデータセットから、マハラノビス距離を用いて前記信号データ群の評価を行うための評価方法をコンピュータに実行させるためのプログラムであって、
     前記単位データ群を、前記複数のデータ項目のうち少なくとも1以上の項目を含む、2以上のグループにグルーピングし、
     前記2以上のグループにグルーピングされた前記単位データ群である前記2以上のグループ別単位データ群のそれぞれにおける単位空間を、グループ別単位空間として算出し、
     算出した前記グループ別単位空間を用いて、対応する前記グループ別単位データ群の第1マハラノビス距離を算出し、
     算出した前記グループ別単位空間それぞれを用いて、対応するデータ項目における前記信号データ群の第2マハラノビス距離を算出し、
     算出した複数の前記第1マハラノビス距離の第1線形和を算出し、
     算出した複数の前記第2マハラノビス距離の第2線形和を算出し、
     算出した前記第1線形和と前記第2線形和とを比較して、比較結果を出力する、
     プログラム。
PCT/JP2019/050727 2019-01-29 2019-12-25 評価装置、評価方法及びプログラム WO2020158266A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US17/423,711 US20220083818A1 (en) 2019-01-29 2019-12-25 Evaluation device, evaluation method, and recording medium
CN201980089213.7A CN113348449A (zh) 2019-01-29 2019-12-25 评价装置、评价方法以及程序
JP2020569452A JP7398641B2 (ja) 2019-01-29 2019-12-25 評価装置、評価方法及びプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-013089 2019-01-29
JP2019013089 2019-01-29

Publications (1)

Publication Number Publication Date
WO2020158266A1 true WO2020158266A1 (ja) 2020-08-06

Family

ID=71839954

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/050727 WO2020158266A1 (ja) 2019-01-29 2019-12-25 評価装置、評価方法及びプログラム

Country Status (4)

Country Link
US (1) US20220083818A1 (ja)
JP (1) JP7398641B2 (ja)
CN (1) CN113348449A (ja)
WO (1) WO2020158266A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11846979B1 (en) * 2022-06-01 2023-12-19 Sas Institute, Inc. Anomaly detection and diagnostics based on multivariate analysis

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010181188A (ja) * 2009-02-03 2010-08-19 Mitsubishi Heavy Ind Ltd プラント運転状態監視方法
JP2013041491A (ja) * 2011-08-18 2013-02-28 Ihi Corp 異常診断装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010181188A (ja) * 2009-02-03 2010-08-19 Mitsubishi Heavy Ind Ltd プラント運転状態監視方法
JP2013041491A (ja) * 2011-08-18 2013-02-28 Ihi Corp 異常診断装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FUJI, TAKAHIRO: "Similar impression retrieval of facial images based on hair characteristics", IPSJ TECHNICAL REPORT ON GRAPHICS AND CAD(CG) , 3.4 SIMILARITY CALCULATION, vol. 3.4, 21 November 2013 (2013-11-21), pages 1 - 6 *

Also Published As

Publication number Publication date
US20220083818A1 (en) 2022-03-17
JP7398641B2 (ja) 2023-12-15
CN113348449A (zh) 2021-09-03
JPWO2020158266A1 (ja) 2021-12-02

Similar Documents

Publication Publication Date Title
Ballabio et al. Multivariate comparison of classification performance measures
Bauder et al. The effects of varying class distribution on learner behavior for medicare fraud detection with imbalanced big data
Hossain et al. Use of electronic health data for disease prediction: A comprehensive literature review
Jagtap et al. Heart disease prediction using machine learning
Karthik et al. Predicting bipolar disorder and schizophrenia based on non-overlapping genetic phenotypes using deep neural network
Yu et al. Predicting hospital readmission: a joint ensemble-learning model
JP2008008708A (ja) 判定知識作成装置、判定知識作成方法、プログラムおよび記録媒体
Luo et al. An informative approach on differential abundance analysis for time-course metagenomic sequencing data
Hornung et al. Improving cross-study prediction through addon batch effect adjustment or addon normalization
WO2020158266A1 (ja) 評価装置、評価方法及びプログラム
Musigmann et al. Testing the applicability and performance of Auto ML for potential applications in diagnostic neuroradiology
Brindise et al. Machine learning-based pre-discharge prediction of hospital readmission
US20220262528A1 (en) Method and apparatus with adverse drug reaction detection based on machine learning
Ramirez et al. Prediction of diabetic patient readmission using machine learning
Segura-Alabart et al. Nonunique UPGMA clusterings of microsatellite markers
US20200134430A1 (en) Analyzing apparatus, analysis method and analysis program
Sahu et al. DCNN-SVM: A new approach for lung cancer detection
Balabhadrapathruni et al. A study on analysing the impact of feature selection on predictive machine learning algorithms
Bayati et al. A low-cost method for multiple disease prediction
Alatrany et al. A novel hybrid machine learning approach using deep learning for the prediction of Alzheimer disease using genome data
Ahmed et al. Genetic variations analysis for complex brain disease diagnosis using machine learning techniques: opportunities and hurdles
Conde et al. Isotonic boosting classification rules
Mahmoodian et al. Using fuzzy association rule mining in cancer classification
Huang et al. Machine learning methods to predict 30-day hospital readmission outcome among US adults with pneumonia: analysis of the national readmission database
Bobrowski et al. Selection of genetic and phenotypic features associated with inflammatory status of patients on dialysis using relaxed linear separability method

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19913084

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2020569452

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19913084

Country of ref document: EP

Kind code of ref document: A1