WO2018180197A1 - データ解析装置、データ解析方法およびデータ解析プログラム - Google Patents

データ解析装置、データ解析方法およびデータ解析プログラム Download PDF

Info

Publication number
WO2018180197A1
WO2018180197A1 PCT/JP2018/008007 JP2018008007W WO2018180197A1 WO 2018180197 A1 WO2018180197 A1 WO 2018180197A1 JP 2018008007 W JP2018008007 W JP 2018008007W WO 2018180197 A1 WO2018180197 A1 WO 2018180197A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
learning
unit
analysis
frequency
Prior art date
Application number
PCT/JP2018/008007
Other languages
English (en)
French (fr)
Inventor
京子 加藤
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to US16/495,145 priority Critical patent/US11593299B2/en
Priority to CN201880022162.1A priority patent/CN110476158A/zh
Priority to JP2019509052A priority patent/JP6828807B2/ja
Publication of WO2018180197A1 publication Critical patent/WO2018180197A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks

Definitions

  • the present invention relates to a data analysis device, a data analysis method, and a data analysis program.
  • vibration data refers to data that varies with time, for example.
  • the data acquired by the sensor is often long time series data.
  • Knowledge in fields such as statistical analysis and machine learning is required to extract useful information from long time-series data and perform abnormality detection. It is also required to repeatedly execute various processing processes on the data.
  • the abnormal state of the device may be automatically detected.
  • the accuracy of the detection model can be improved by performing frequency analysis on a lot of vibration data.
  • Patent Document 1 a calculation unit that calculates the importance for each region by scanning each frame constituting the moving image for each region of a predetermined size, and at least one by clustering the regions based on the importance
  • An image processing apparatus including a clustering unit that generates a region cluster is described.
  • Patent Document 2 describes a data processing system including learning means for learning and modeling a relationship between a teacher label assigned to at least one region on a learning image and an image in the region.
  • the data processing system described in Patent Document 2 receives a detection image different from a learning image as an input, and includes a detection image that has been subjected to predetermined image processing and a detection image that has not been subjected to image processing.
  • Each has a detection means for detecting a region including the object based on the model.
  • a threshold value can be set in an area where a threshold value can exist even in the worst case by narrowing down the existing area of a threshold value that separates normal data and abnormal data in advance.
  • a process abnormality diagnosis apparatus capable of clustering data is described.
  • Patent Document 4 describes an evaluation that can reduce the burden of arithmetic processing when diagnosing the presence or absence of an abnormality in a mechanical facility that includes one or more sliding members, and can speed up diagnostic work and improve reliability. A method is described. The evaluation method described in Patent Document 4 generates actually measured frequency spectrum data from sound or vibration generated from mechanical equipment.
  • Patent Document 2 When the technique described in Patent Document 2 is used, a labeling operation with a large cost is efficiently performed.
  • the techniques described in Patent Document 1 and Patent Document 3 to Patent Document 4 are used, useful information is extracted from long time-series data such as data acquired by the sensor and is effective. Analysis conditions are also discovered.
  • Patent Document 2 describes reducing the effort of labeling the learning image, but does not describe improving the accuracy of the model generated by devising the learning process. .
  • Patent Document 1 and Patent Documents 3 to 4 do not describe improving the accuracy of a model generated by devising a learning process.
  • an object of the present invention is to provide a data analysis apparatus, a data analysis method, and a data analysis program that can improve the accuracy of a model generated by learning processing, which solves the above-described problems.
  • a data analysis apparatus includes a frequency analysis unit that performs frequency analysis of a plurality of learning data including a plurality of classes of learning data partially provided with labels indicating data classes for each learning data under a predetermined condition
  • a cluster analysis unit that clusters the frequency-analyzed learning data into the number of classes of the frequency-analyzed learning data, and the frequency-analyzed learning data that is assigned the same label based on each cluster is the same cluster
  • the minimum degree is calculated among the plurality of degrees calculated when the frequency analysis unit frequency-analyzes the learning data for the plurality of classes under the plurality of conditions, and the calculation unit that calculates the degree not included in To select the clustering result by the cluster analysis unit as a clustering model to label the learning data Characterized in that it comprises and.
  • the data analysis method performs frequency analysis on a plurality of learning data including learning data of a plurality of classes partially assigned with labels indicating data classes under a predetermined condition for each learning data, and frequency analysis
  • the learning data is clustered into the number of classes of the frequency-analyzed learning data, and the degree to which the frequency-analyzed learning data with the same label based on each cluster is not included in the same cluster is calculated.
  • the minimum degree is calculated among the plurality of degrees calculated when the learning data of a plurality of classes are respectively subjected to frequency analysis under a plurality of conditions It is selected as a clustering model.
  • the data analysis program frequency-analyzes a plurality of learning data including a plurality of classes of learning data to which a part of a label indicating the data class is given to the computer under a predetermined condition for each learning data.
  • Frequency analysis processing cluster analysis processing that clusters the frequency-analyzed learning data into the number of classes of frequency-analyzed learning data, and the frequency-analyzed learning data that is assigned the same label based on each cluster Calculation processing to calculate the degree not included in the cluster, and clustering when the minimum degree is calculated among the plurality of degrees calculated when the learning data of multiple classes is analyzed by multiple conditions under multiple conditions Selection process for selecting the result as a clustering model for labeling learning data Characterized in that to execute.
  • the accuracy of the model generated by the learning process can be improved.
  • FIG. 1 is a block diagram showing a configuration example of a first embodiment of a data analysis apparatus according to the present invention.
  • the data analysis apparatus 10 according to the present invention performs frequency analysis of a plurality of learning data including a plurality of classes of learning data partially provided with labels indicating data classes under a predetermined condition for each learning data.
  • a unit 11 for example, a learning frequency analysis unit 121
  • a cluster analysis unit 12 for example, a clustering processing unit 122 for clustering the frequency-analyzed learning data into the number of classes of the frequency-analyzed learning data
  • There are a plurality of calculation units 13 for example, fraud rate calculation unit 128, for calculating the degree that frequency-analyzed learning data assigned the same label based on each cluster is not included in the same cluster
  • a plurality of frequency analysis units 11 The minimum degree is calculated among the multiple degrees calculated when frequency analysis is performed for each class of learning data under the conditions
  • Selector 14 e.g., the best condition selection unit 123 for clustering result by the cluster analysis unit 12 selects the learning data as a clustering model for imparting label when the and a.
  • FIG. 2 is a flowchart illustrating the operation of the analysis process performed by the data analysis apparatus 10 according to the first embodiment.
  • the frequency analysis unit 11 takes out predetermined conditions for which frequency analysis has not yet been performed among the specified conditions. That is, the condition loop is entered (step S11).
  • the frequency analysis unit 11 performs frequency analysis on a plurality of learning data including a plurality of classes of learning data to which a label indicating a data class is partly assigned under a predetermined condition for each learning data (step S12).
  • the cluster analysis unit 12 clusters the learning data subjected to frequency analysis into the number of classes of learning data subjected to frequency analysis (step S13).
  • the calculation unit 13 calculates the degree that the learning data subjected to frequency analysis to which the same label is assigned based on each cluster is not included in the same cluster (step S14).
  • the data analysis apparatus 10 repeatedly executes the processing from step S12 to step S14 while there is a condition where the frequency analysis is not performed among the specified conditions. Steps S12 to S14 are repeatedly executed for each condition by the number of designated conditions.
  • the data analysis apparatus 10 exits the condition loop (step S15).
  • the selection unit 14 selects the clustering result by the cluster analysis unit 12 when the minimum degree is calculated among the plurality of calculated degrees as a clustering model for giving a label to the learning data (step S16). ). After the selection, the data analysis device 10 ends the analysis process.
  • the data analysis apparatus can improve the accuracy of the model generated by the learning process.
  • the data analysis apparatus 10 may include a learning unit (for example, a learning unit 127) that generates a model for data determination of a predetermined class by performing learning processing using the selected clustering model.
  • a learning unit for example, a learning unit 127 that generates a model for data determination of a predetermined class by performing learning processing using the selected clustering model.
  • the data analysis apparatus can generate a model with higher accuracy by learning processing.
  • the data analysis apparatus 10 may include a storage unit (for example, the condition storage unit 130) that stores conditions corresponding to the selected clustering model.
  • a storage unit for example, the condition storage unit 130
  • the data analysis apparatus can manage optimum frequency analysis conditions.
  • the data analysis apparatus 10 includes a determination unit (for example, a determination unit 163) that determines whether the determination data is data of a predetermined class, and the frequency analysis unit 11 stores the determination data in the storage unit. Frequency analysis is performed under the stored conditions, and the determination unit uses a model for determining data of a predetermined class generated by the learning unit whether the determination data subjected to frequency analysis is data of a predetermined class. May be determined.
  • a determination unit for example, a determination unit 163
  • the frequency analysis unit 11 stores the determination data in the storage unit. Frequency analysis is performed under the stored conditions, and the determination unit uses a model for determining data of a predetermined class generated by the learning unit whether the determination data subjected to frequency analysis is data of a predetermined class. May be determined.
  • the data analysis apparatus can determine the type of determination data using a highly accurate model.
  • the learning unit may perform learning processing using data obtained by performing matrix conversion on the learning data subjected to frequency analysis.
  • the data analysis apparatus can generate data suitable for the learning processing algorithm.
  • the learning process may be performed according to a deep learning algorithm.
  • the data analysis apparatus can generate a model with higher accuracy by learning processing.
  • FIG. 3 is a block diagram showing a configuration example of the second embodiment of the vibration data analyzing apparatus according to the present invention.
  • the vibration data analysis apparatus of the present embodiment acquires a spectrogram by performing frequency analysis of vibration data sets with time. Next, the vibration data analysis apparatus generates an abnormality detection model by performing machine learning using the acquired spectrogram.
  • the vibration data analysis apparatus of the present embodiment comprehensively performs frequency analysis on the vibration data set using various conditions such as analysis target range and frequency in addition to time.
  • the vibration data analysis apparatus performs frequency analysis under each condition, and then clusters the data sets subjected to frequency analysis into two.
  • the vibration data analyzer assigns a “normal” label or an “abnormal” label to the spectrogram based on the best result of clustering.
  • the vibration data analysis apparatus 100 includes a learning vibration data storage unit 110, a vibration data learning unit 120, a condition storage unit 130, a model storage unit 140, and a determination vibration data storage unit 150.
  • a vibration data determination unit 160 is included in the vibration data analysis apparatus 100.
  • the vibration data analysis device 100 is a device that analyzes vibration data.
  • the vibration data analyzing apparatus 100 is, for example, a personal computer (PC). Further, the vibration data analysis apparatus 100 may be a server, a smartphone, or the like.
  • the vibration data analyzing apparatus 100 may be realized by one terminal or a plurality of terminals.
  • the vibration data learning unit 120 and the vibration data determination unit 160 may be included in the same terminal, or may be included in different terminals.
  • the learning vibration data storage unit 110 has a function of storing a vibration data group (time series data set) that is time series data used for machine learning.
  • the learning vibration data storage unit 110 stores time-series data including numerical values in a CSV (Comma-Separated Value) value file format for each target data.
  • the learning vibration data storage unit 110 is a general storage device.
  • the vibration data learning unit 120 includes a learning frequency analysis unit 121, a clustering processing unit 122, a best condition selection unit 123, a learning matrix conversion unit 125, a label assignment unit 126, a learning Part 127.
  • the vibration data learning unit 120 performs time-frequency analysis on the learning vibration data held in the learning vibration data storage unit 110. Next, the vibration data learning unit 120 performs supervised machine learning using data subjected to time-frequency analysis (hereinafter referred to as time-frequency analysis data) to generate an abnormality detection model.
  • time-frequency analysis data data subjected to time-frequency analysis
  • the learning frequency analysis unit 121 has a function of generating time-frequency analysis data by performing time-frequency analysis on a time-series data set (learning vibration data set) based on a group of conditions prepared in advance.
  • the frequency analysis condition is, for example, a combination of the analysis target range, time condition, and frequency condition.
  • the analysis target range is a condition for extracting the analysis target range in time.
  • the analysis target range specifies a time range to be analyzed in the vibration data for learning.
  • time 0 to time 2 or “time 10 to time 30” is specified as the analysis target range.
  • the analysis target range is defined in advance by the user or the system.
  • the time condition is a time axis condition when the range specified in the analysis target range is analyzed.
  • the time condition indicates the number of section divisions on the time axis such as 4 divisions or 8 divisions.
  • the time condition is defined in advance by the user or the system.
  • the frequency condition is a frequency axis condition when the range specified in the analysis target range is analyzed.
  • the frequency condition indicates the number of bands or bandwidth such as 4 bands, 8 bands, or 12 bands. That is, the frequency condition indicates the number of divisions on the frequency axis.
  • the frequency condition is defined in advance by the user or the system.
  • FIG. 4 is an explanatory diagram showing an example of time frequency analysis processing by the learning frequency analysis unit 121.
  • FIG. 4A shows the vibration data for learning to be processed.
  • the inside of the dotted rectangle shown in FIG. 4A is the range specified in the analysis target range.
  • the learning frequency analysis unit 121 performs, for example, fast Fourier transform on the data in the range specified in the analysis target range for each unit divided by the number of section divisions indicated by the time condition. Next, the learning frequency analysis unit 121 calculates a power integrated value based on a value output by the fast Fourier transform, and generates a power vector.
  • FIG. 4B shows a graph on which the time frequency analysis data generated by the learning frequency analysis unit 121 is displayed.
  • P ij on the horizontal axis means a power spectrum in the interval i and the frequency band f j .
  • the vertical axis represents the power spectrum value (power).
  • Other conditions for the time-frequency analysis are as shown in the example of FIG.
  • FIG. 4C shows the power vector generated by the learning frequency analysis unit 121.
  • T i means the time window length in the interval i.
  • the power vector is composed of a power spectrum.
  • the clustering processing unit 122 has a function of clustering the learning vibration data set into normal data and abnormal data for each frequency analysis condition based on the time-frequency analysis data.
  • the clustering method used by the clustering processing unit 122 is, for example, the k-means method. Note that the clustering processing unit 122 may perform clustering by a method other than the k-means method.
  • the best condition selection unit 123 has a function of selecting the clustering model that maximizes the distance between the centers of the clusters as the best model.
  • the best condition selection unit 123 stores the best condition, which is a frequency analysis condition corresponding to the selected clustering model, in the condition storage unit 130.
  • the best condition selection unit 123 includes a distance calculation unit 124.
  • the distance calculation unit 124 has a function of calculating the distance between the centers of the clusters.
  • the distance calculation unit 124 calculates, for example, the Euclidean distance as the distance.
  • the distance calculation unit 124 may calculate a distance other than the Euclidean distance.
  • FIG. 5 is an explanatory diagram illustrating an example of a distance calculation process performed by the distance calculation unit 124.
  • FIG. 5A shows the vibration data for learning to be processed.
  • the learning vibration data to be processed is 20 pieces of D 1 to D 20 .
  • FIG. 5B shows a time frequency analysis result by the learning frequency analysis unit 121.
  • FIG. 5C shows a clustering model generation result by the clustering processing unit 122.
  • the “first condition: clustering result” in FIG. 5C is the time frequency analysis result in the first condition shown in FIG. 5B represented by data that the clustering processing unit 122 represents with white circles and black circles. This is the result of clustering the data.
  • the distance calculation unit 124 calculates the distance between the centers of each cluster. As shown in FIG. 5C, the distance between clusters is larger in the second condition than in the first condition. That is, the second condition is a more preferable condition.
  • the learning matrix conversion unit 125 has a function of performing matrix conversion of the time-frequency analysis data into a format suitable for the learning algorithm. For example, when the learning unit 127 uses a convolutional neural network (CNN) as a learning algorithm, the learning matrix conversion unit 125 converts the time-frequency analysis data into an image.
  • CNN convolutional neural network
  • FIG. 6 is an explanatory diagram illustrating an example of matrix conversion processing by the learning matrix conversion unit 125.
  • the learning matrix conversion unit 125 converts the power vector into a grayscale spectrogram image.
  • L ij is a value (luminance value) obtained by subjecting P ij to matrix transformation.
  • FIG. 6 shows an example in which the power vector is converted into a grayscale image
  • the learning matrix conversion unit 125 may convert the power vector into a color image.
  • the label assigning unit 126 has a function of assigning a “normal” label or an “abnormal” label to the time-frequency analysis data after the matrix conversion.
  • the learning vibration data set often contains less abnormal data than normal data. Therefore, when assigning a “normal” label or an “abnormal” label, the label assigning unit 126 assigns an “abnormal” label to data belonging to a cluster with fewer elements, and belongs to a cluster with more elements. A label “normal” may be attached to the data.
  • labeling itself may be performed manually.
  • a label is manually added, for example, only representative data such as data located at the center of the cluster is visually confirmed, and then a “normal” label or an “abnormal” label is added to the data.
  • the learning unit 127 has a function of performing supervised machine learning using the time-frequency analysis data after the matrix conversion to which the label is given. By performing supervised machine learning, the learning unit 127 generates an abnormality detection model.
  • the learning algorithm of supervised machine learning performed by the learning unit 127 is a deep learning algorithm such as a convolutional neural network (CNN).
  • CNN convolutional neural network
  • the learning algorithm may be an algorithm other than the deep learning algorithm.
  • the condition storage unit 130 has a function of holding the best condition for time-frequency analysis selected by the best condition selection unit 123 of the vibration data learning unit 120.
  • the condition storage unit 130 is a general storage device, like the learning vibration data storage unit 110.
  • the model storage unit 140 has a function of holding the learned abnormality detection model generated by the vibration data learning unit 120.
  • the model storage unit 140 is a general storage device, similar to the learning vibration data storage unit 110.
  • the determination vibration data storage unit 150 has a function of storing a determination target vibration data group.
  • the determination vibration data storage unit 150 is a general storage device, similar to the learning vibration data storage unit 110.
  • the vibration data determination unit 160 includes a determination frequency analysis unit 161, a determination matrix conversion unit 162, and a determination unit 163.
  • the vibration data determination unit 160 performs time frequency analysis and matrix transformation on the determination vibration data held in the determination vibration data storage unit 150. Next, the vibration data determination unit 160 determines whether the determination vibration data is normal data or abnormal data by inputting the time-frequency analysis data after the matrix conversion to the abnormality detection model.
  • the determination frequency analysis unit 161 has the same function as the learning frequency analysis unit 121.
  • the determination frequency analysis unit 161 acquires the conditions stored in the condition storage unit 130 and uses them as conditions for the time frequency analysis.
  • the determination matrix converter 162 has the same function as the learning matrix converter 125.
  • the determination unit 163 inputs the time frequency analysis data after the matrix conversion to the abnormality detection model acquired from the model storage unit 140, so that the determination vibration data to be determined is normal data or abnormal data. It has a function to determine whether or not there is.
  • the operation of the vibration data analyzing apparatus 100 of the present embodiment will be described with reference to FIGS.
  • the operation of the vibration data analyzing apparatus 100 is classified into two operations: an operation in the learning phase and an operation in the determination phase.
  • the vibration data analyzing apparatus 100 In the learning phase, the vibration data analyzing apparatus 100 generates an abnormality detection model by learning the relationship between vibration data to be learned, normal data, and abnormal data. In the determination phase, the vibration data analysis apparatus 100 determines whether the vibration data to be determined is normal data or abnormal data by inputting the vibration data to be determined to the abnormality detection model.
  • FIG. 7 is a flowchart illustrating the learning process performed by the vibration data analysis apparatus 100 according to the second embodiment.
  • the vibration data learning unit 120 acquires a learning vibration data set used for learning from the learning vibration data storage unit 110.
  • the vibration data learning unit 120 reads the acquired vibration data set for learning (step S101).
  • the vibration data learning unit 120 extracts a combination of conditions for which frequency analysis has not yet been performed, from among the combinations of specified frequency analysis conditions. That is, a conditional loop is entered (step S102).
  • the vibration data learning unit 120 extracts learning vibration data that has not yet been subjected to frequency analysis from the read learning vibration data set. That is, the frequency analysis loop is entered (step S103).
  • the learning frequency analysis unit 121 of the vibration data learning unit 120 generates time frequency analysis data such as a power vector by performing time frequency analysis under the condition that the target learning vibration data is extracted (step S104).
  • the extracted condition is a combination of the analysis target range, the time condition, the frequency condition, and the like described above.
  • the learning frequency analysis unit 121 repeatedly executes the process of step S104 while there is learning vibration data that has not been subjected to temporal frequency analysis in the read learning vibration data set.
  • the processing in step S104 is repeatedly executed for each learning vibration data by the number of learning vibration data acquired in step S101.
  • the learning frequency analysis unit 121 exits the frequency analysis loop (step S105).
  • the clustering processing unit 122 of the vibration data learning unit 120 clusters the time-frequency analysis data sets into two for each condition (step S106).
  • the distance calculation unit 124 of the best condition selection unit 123 of the vibration data learning unit 120 calculates the distance L between the centers of the clusters (step S107).
  • the vibration data learning unit 120 repeatedly executes the processing from step S103 to step S108 while there is a combination of conditions in which the time frequency analysis is not performed among the combinations of the specified frequency analysis conditions.
  • the processing in steps S103 to S108 is repeatedly executed for each combination of conditions by the number of combinations of the specified frequency analysis conditions.
  • the learning frequency analysis unit 121 exits the condition loop (step S109).
  • the best condition selection unit 123 compares the maximum value max (L) of the distance with a preset threshold value d, and confirms whether max (L) is smaller than d (step S110).
  • the threshold value d may not be set in advance.
  • Step S111 the best condition selection unit 123 regards it as a clustering failure.
  • the vibration data analysis apparatus 100 ends the learning process.
  • the best condition selection unit 123 stores the best condition (analysis target range, time condition, frequency condition) in the condition storage unit 130 (step S112).
  • the vibration data learning unit 120 extracts time-frequency analysis data that has not yet been labeled from the stored time-frequency analysis data set under the best conditions. That is, the labeling loop is entered (step S113).
  • the matrix conversion unit 125 for learning of the vibration data learning unit 120 performs matrix conversion of the time-frequency analysis data under the target best condition into a format suitable for the learning algorithm (step S114).
  • the label assigning unit 126 of the vibration data learning unit 120 classifies the matrix-transformed data using a clustering model (clustering result) corresponding to the best condition.
  • the label assigning unit 126 assigns a “normal” label or an “abnormal” label to the classified data (step S115).
  • the vibration data learning unit 120 repeatedly executes the processing from step S114 to step S115 while there is unlabeled time frequency analysis data in the time frequency analysis data set.
  • the processing from step S114 to step S115 is repeatedly executed for each time frequency analysis data by the number of learning vibration data acquired in step S101.
  • the vibration data learning unit 120 exits the labeling loop (step S116).
  • the learning unit 127 performs supervised machine learning using the learning vibration data set (time-frequency analysis data set after matrix transformation) to which the label is assigned in step S115 (step S117). By performing supervised machine learning, the learning unit 127 generates an abnormality detection model.
  • the learning unit 127 stores the abnormality detection model generated in step S117 in the model storage unit 140 (step S118). After saving, the vibration data analyzing apparatus 100 ends the learning process.
  • the learning unit 127 automatically adopts the clustering model having the maximum distance between clusters as the best model.
  • the best condition selection unit 123 may input clustering model candidates to the learning matrix conversion unit 125 in order of increasing distance, and the learning unit 127 may select the best model from a plurality of models.
  • FIG. 8 is a flowchart illustrating the operation of the determination process performed by the vibration data analysis apparatus 100 according to the second embodiment.
  • the vibration data determination unit 160 reads the abnormality detection model generated by the learning unit 127 from the model storage unit 140 (step S121).
  • the vibration data determination unit 160 acquires a determination vibration data set from the determination vibration data storage unit 150.
  • the vibration data determination unit 160 reads the acquired determination vibration data set (step S122).
  • the vibration data determination unit 160 reads the best condition selected by the best condition selection unit 123 from the condition storage unit 130 (step S123).
  • the vibration data determination unit 160 takes out vibration data for determination that has not been determined yet from the read vibration data set for determination. That is, the determination loop is entered (step S124).
  • the determination frequency analysis unit 161 of the vibration data determination unit 160 performs time-frequency analysis on the target determination vibration data under the best conditions (analysis target range, time condition, frequency condition) read in step S123, thereby obtaining a power vector. Etc. are generated (step S125).
  • the time frequency analysis process is the same as the process in step S104 of the learning phase.
  • the determination matrix conversion unit 162 of the vibration data determination unit 160 performs matrix conversion on the time-frequency analysis data (step S126).
  • the matrix transformation process is the same as the process in step S114 of the learning phase.
  • the determination unit 163 of the vibration data determination unit 160 inputs the time frequency analysis data subjected to matrix transformation in step S126 to the abnormality detection model read in step S121, whereby the target determination vibration data is normal data. Or abnormal data (step S127).
  • the vibration data determination unit 160 repeatedly executes the processing from step S125 to step S127 while there is determination vibration data that has not been determined in the determination vibration data set.
  • the processing from step S125 to step S127 is repeatedly executed for each determination vibration data by the number of determination vibration data acquired in step S122.
  • the vibration data determination unit 160 exits the determination loop (step S128). After exiting the determination loop, the vibration data analyzing apparatus 100 ends the determination process. Through the above processing, the vibration data analyzing apparatus 100 can determine whether the vibration data is normal data or abnormal data.
  • the learning frequency analysis unit 121 of the vibration data learning unit 120 of the present embodiment performs frequency analysis on a vibration data set, which is a set of time series data, under various conditions (analysis target range, frequency, time, etc.).
  • the clustering processing unit 122 clusters each learning vibration data into two based on the frequency analysis data for each condition. Next, the best condition selection unit 123 selects the best clustering model.
  • the learning matrix conversion unit 125 performs matrix conversion of the frequency analysis data in accordance with the learning algorithm.
  • the label assigning unit 126 assigns a “normal” label or an “abnormal” label to the frequency-analyzed data subjected to matrix transformation using the selected best clustering model.
  • the learning unit 127 performs machine learning using the data provided with the label, and generates an abnormality detection model.
  • the vibration data learning unit 120 can efficiently perform the labeling operation. That is, the man-hour required for labeling is reduced.
  • the learning unit 127 is generated to learn a characteristic part extracted according to a combination of the analysis target range, time, frequency, and the like as a determination factor as to whether the data is normal data or abnormal data. The accuracy of the anomaly detection model is improved.
  • the vibration data determination unit 160 of the present embodiment can detect abnormal vibration data. Furthermore, when the learning unit 127 performs supervised learning in which deep learning is used, the determination unit 163 can determine vibration data for determination after grasping finer features than when only clustering is performed.
  • FIG. 9 is a block diagram showing a configuration example of the third embodiment of the vibration data analyzing apparatus according to the present invention.
  • the configuration of the vibration data analysis apparatus 101 of the present embodiment is the same as that of the vibration data analysis apparatus 100 of the second embodiment, except that the best condition selection unit 123 has an fraud rate calculation unit 128 instead of the distance calculation unit 124. It is the same.
  • the vibration data set for learning stored in the vibration data storage unit for learning 110 of the present embodiment includes vibration data to which a “normal” label or an “abnormal” label is assigned in advance. Yes.
  • the vibration data learning unit 120 extracts learning vibration data to which a label is attached.
  • the fraud rate calculation unit 128 of the present embodiment calculates the fraud rate indicating the degree to which data with the same label is not grouped in the same cluster.
  • the best condition selection unit 123 of the present embodiment selects not the combination of conditions that maximizes the distance between clusters but the combination of conditions that minimizes the calculated fraud rate as the best condition.
  • the fraud rate calculation unit 128 sets the fraud rate to “(m / M) + (n / N) ".
  • the fraud rate calculation unit 128 may calculate the fraud rate by any method as long as it indicates the degree to which data with the same label is not grouped in the same cluster.
  • the best condition selection unit 123 of the present embodiment may determine that the clustering has failed when the calculated fraud rate is greater than the threshold value d.
  • FIG. 10 is a flowchart illustrating the learning process performed by the vibration data analysis apparatus 101 according to the third embodiment.
  • the operation in the determination phase of the vibration data analysis apparatus 101 of the present embodiment is the same as the operation of the determination process shown in FIG.
  • the vibration data learning unit 120 acquires a learning vibration data set to which a label used for learning is attached from the learning vibration data storage unit 110.
  • the vibration data learning unit 120 reads the acquired vibration data set for learning (step S201).
  • step S202 to step S206 is the same as the processing from step S102 to step S106 shown in FIG.
  • the fraud rate calculation unit 128 of the best condition selection unit 123 of the vibration data learning unit 120 calculates the fraud rate W of the clustering result (step S207).
  • step S209 is the same as the processing in step S109 shown in FIG.
  • the best condition selection unit 123 compares the minimum fraud rate value min (W) with a preset threshold value d to check whether min (W) is larger than d (step S210).
  • the threshold value d may not be set in advance.
  • step S210 If min (W) is greater than d (True in step S210), the best condition selection unit 123 regards it as a clustering failure (step S211).
  • the vibration data analysis apparatus 100 ends the learning process.
  • the best condition selection unit 123 stores the best condition (analysis target range, time condition, frequency condition) in the condition storage unit 130 (step S212).
  • step S213 to step S218 is the same as the processing from step S113 to step S118 shown in FIG.
  • the clustering processing unit 122 performs clustering using vibration data to which a correct label is given in advance, and the best condition selection unit 123 selects the best condition based on the clustering result.
  • the accuracy of the generated abnormality detection model can be improved.
  • the vibration data analysis apparatus of each embodiment is expected to be suitably used in the field of machine tool failure detection and the like.
  • the data analysis device 10, the vibration data analysis device 100, and the vibration data analysis device 101 of each embodiment are, for example, a CPU (Central Processing Unit) that executes processing according to a program stored in a non-temporary storage medium. It may be realized by. That is, the frequency analysis unit 11, the cluster analysis unit 12, the calculation unit 13, the selection unit 14, the learning frequency analysis unit 121, the clustering processing unit 122, the best condition selection unit 123, the learning matrix conversion unit 125, the label assignment unit 126, The learning unit 127, the determination frequency analysis unit 161, the determination matrix conversion unit 162, and the determination unit 163 may be realized by, for example, a CPU that executes processing according to program control.
  • a CPU Central Processing Unit
  • the learning vibration data storage unit 110 may be realized by, for example, a RAM (Random Access Memory).
  • RAM Random Access Memory
  • each unit in the data analysis device 10, the vibration data analysis device 100, and the vibration data analysis device 101 of each embodiment may be realized by a hardware circuit.
  • the conversion unit 125, the label assignment unit 126, the learning unit 127, the condition storage unit 130, the model storage unit 140, the determination vibration data storage unit 150, the determination frequency analysis unit 161, the determination matrix conversion unit 162, and the determination unit 163 are realized by LSI (Large Scale Integration). Further, they may be realized by a single LSI.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

データ解析装置10は、データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを学習用データごとに所定の条件で周波数解析する周波数解析部11と、周波数解析された学習用データを周波数解析された学習用データのクラスの数にクラスタリングするクラスタ分析部12と、各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出する算出部13と、周波数解析部11が複数の条件で複数のクラスの学習用データをそれぞれ周波数解析した時に算出された複数の度合いのうち最小の度合いが算出された時のクラスタ分析部12によるクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する選択部14とを備える。

Description

データ解析装置、データ解析方法およびデータ解析プログラム
 本発明は、データ解析装置、データ解析方法およびデータ解析プログラムに関する。
 センサ等が取得した振動データを基に、センサ等の観測対象の機器の異常を自動的に検出する技術に対して需要が存在する。なお、振動データは、例えば時間の経過に伴って変動しているデータを指す。
 一般的に、センサが取得するデータは、長大な時系列データであることが多い。長大な時系列データの中から有用な情報を取り出し異常検出等を行うためには、統計解析や機械学習等の分野における知識が求められる。また、データに対して様々な加工処理を繰り返し実行することも求められる。
 また、振動データを解析する場合、高速フーリエ変換(FFT:Fast Fourier Transform)等で振動データを周波数解析することが有効であることが知られている。
 例えば、機器の管理者が取得された振動データを見れば、機器の状態が正常であるか異常であるかを判別できる場合が多い。よって、管理者が状態を判別する作業を検出モデルを用いて自動化する機械学習が実行されれば、機器の異常状態が自動検知される可能性がある。
 しかし、機械学習では、多くの振動データへの「正常」のラベルか「異常」のラベルの付与が求められる。すなわち、機械学習が実行される場合、コストが大きいラベル付け作業の実行が求められるという問題がある。
 また、多くの振動データに対して周波数解析が行われることによって、検出モデルの精度の向上が見込まれる。しかし、単に周波数解析が実行されるだけでは、センサが取得するデータのような長大な時系列データの中から有用な情報を取り出し、有効な解析条件を発見することは依然として困難なままである。
 特許文献1には、動画像を構成する各フレームを所定のサイズの領域毎に走査して領域毎の重要度を算出する算出部と、領域を重要度に基づいてクラスタリングすることによって少なくとも1つの領域クラスタを生成するクラスタリング部とを備える画像処理装置が記載されている。
 また、特許文献2には、学習用画像上の少なくとも一つの領域に付与された教師ラベルと領域の画像との関係を学習してモデル化する学習手段を備えるデータ処理システムが記載されている。特許文献2に記載されているデータ処理システムは、学習用画像と異なる検出用画像を入力とし、所定の画像処理が施された検出用画像および画像処理が施されていない検出用画像の中からそれぞれモデルに基づいて対象物を含む領域を検出する検出手段を備える。
 また、特許文献3には、予め正常データと異常データを分離する閾値の存在領域を絞り込むことによって、最悪な場合でも閾値が存在し得る領域に閾値を設定でき、より高信頼に異常データと正常データをクラスタリングできるプロセス異常診断装置が記載されている。
 また、特許文献4には、1または複数の摺動部材を含む機械設備の異常の有無を診断する際の演算処理の負担を軽減し、診断作業の迅速化および信頼性の向上を実現できる評価方法が記載されている。特許文献4に記載されている評価方法は、機械設備から発生した音または振動から実測周波数スペクトルデータを生成する。
 特許文献2に記載されている技術が使用されると、コストが大きいラベル付け作業が効率的に実行される。また、特許文献1、特許文献3~特許文献4に記載されている技術が使用されると、センサが取得するデータのような長大な時系列データの中から有用な情報が取り出され、かつ有効な解析条件も発見される。
特開2016-219879号公報 特開2016-062524号公報 特許第4762088号公報 特許第4003086号公報
 しかし、特許文献2には、学習用画像へのラベル付与の手間を削減することは記載されているが、学習処理を工夫することによって生成されるモデルの精度を向上させることは記載されていない。同様に、特許文献1、特許文献3~特許文献4にも、学習処理を工夫することによって生成されるモデルの精度を向上させることは記載されていない。
[発明の目的]
 そこで、本発明は、上述した課題を解決する、学習処理で生成されるモデルの精度を向上させることができるデータ解析装置、データ解析方法およびデータ解析プログラムを提供することを目的とする。
 本発明によるデータ解析装置は、データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを学習用データごとに所定の条件で周波数解析する周波数解析部と、周波数解析された学習用データを周波数解析された学習用データのクラスの数にクラスタリングするクラスタ分析部と、各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出する算出部と、周波数解析部が複数の条件で複数のクラスの学習用データをそれぞれ周波数解析した時に算出された複数の度合いのうち最小の度合いが算出された時のクラスタ分析部によるクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する選択部とを備えることを特徴とする。
 本発明によるデータ解析方法は、データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを学習用データごとに所定の条件で周波数解析し、周波数解析された学習用データを周波数解析された学習用データのクラスの数にクラスタリングし、各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出し、複数の条件で複数のクラスの学習用データがそれぞれ周波数解析された時に算出された複数の度合いのうち最小の度合いが算出された時のクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択することを特徴とする。
 本発明によるデータ解析プログラムは、コンピュータに、データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを学習用データごとに所定の条件で周波数解析する周波数解析処理、周波数解析された学習用データを周波数解析された学習用データのクラスの数にクラスタリングするクラスタ分析処理、各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出する算出処理、および複数の条件で複数のクラスの学習用データがそれぞれ周波数解析された時に算出された複数の度合いのうち最小の度合いが算出された時のクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する選択処理を実行させることを特徴とする。
 本発明によれば、学習処理で生成されるモデルの精度を向上させることができる。
本発明によるデータ解析装置の第1の実施形態の構成例を示すブロック図である。 第1の実施形態のデータ解析装置10による解析処理の動作を示すフローチャートである。 本発明による振動データ解析装置の第2の実施形態の構成例を示すブロック図である。 学習用周波数解析部121による時間周波数解析処理の例を示す説明図である。 距離算出部124による距離算出処理の例を示す説明図である。 学習用行列変換部125による行列変換処理の例を示す説明図である。 第2の実施形態の振動データ解析装置100による学習処理の動作を示すフローチャートである。 第2の実施形態の振動データ解析装置100による判定処理の動作を示すフローチャートである。 本発明による振動データ解析装置の第3の実施形態の構成例を示すブロック図である。 第3の実施形態の振動データ解析装置101による学習処理の動作を示すフローチャートである。
実施形態1.
 以下、本発明の実施形態を、図面を参照して説明する。図1は、本発明によるデータ解析装置の第1の実施形態の構成例を示すブロック図である。本発明によるデータ解析装置10は、データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを学習用データごとに所定の条件で周波数解析する周波数解析部11(例えば、学習用周波数解析部121)と、周波数解析された学習用データを周波数解析された学習用データのクラスの数にクラスタリングするクラスタ分析部12(例えば、クラスタリング処理部122)と、各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出する算出部13(例えば、不正率算出部128)と、周波数解析部11が複数の条件で複数のクラスの学習用データをそれぞれ周波数解析した時に算出された複数の度合いのうち最小の度合いが算出された時のクラスタ分析部12によるクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する選択部14(例えば、最良条件選択部123)とを備える。
 以下、データ解析装置10による解析処理を説明する。図2は、第1の実施形態のデータ解析装置10による解析処理の動作を示すフローチャートである。
 最初に、周波数解析部11は、指定された条件のうち未だ周波数解析が行われていない所定の条件を取り出す。すなわち、条件ループに入る(ステップS11 )。
 周波数解析部11は、データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを学習用データごとに所定の条件で周波数解析する(ステップS12 )。
 次いで、クラスタ分析部12は、周波数解析された学習用データを周波数解析された学習用データのクラスの数にクラスタリングする(ステップS13 )。
 次いで、算出部13は、各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出する(ステップS14 )。
 データ解析装置10は、指定された条件の中で周波数解析が行われていない条件が存在する間、ステップS12 ~ステップS14 の処理を繰り返し実行する。ステップS12 ~ステップS14 の処理は条件ごとに、指定された条件の数だけ繰り返し実行される。
 指定された周波数解析の全ての条件で周波数解析が行われた時、データ解析装置10は、条件ループを抜ける(ステップS15 )。
 次いで、選択部14は、算出された複数の度合いのうち最小の度合いが算出された時のクラスタ分析部12によるクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する(ステップS16 )。選択した後、データ解析装置10は、解析処理を終了する。
 そのような構成により、データ解析装置は、学習処理で生成されるモデルの精度を向上させることができる。
 また、データ解析装置10は、選択されたクラスタリングモデルを使用して学習処理を行うことによって所定のクラスのデータ判定用のモデルを生成する学習部(例えば、学習部127)を備えてもよい。
 そのような構成により、データ解析装置は、より精度が高いモデルを学習処理で生成できる。
 また、データ解析装置10は、選択されたクラスタリングモデルに対応する条件を記憶する記憶部(例えば、条件記憶部130)を備えてもよい。
 そのような構成により、データ解析装置は、最適な周波数解析の条件を管理できる。
 また、データ解析装置10は、判定用データが所定のクラスのデータであるか否かを判定する判定部(例えば、判定部163)を備え、周波数解析部11は、判定用データを記憶部に記憶されている条件で周波数解析し、判定部は、周波数解析された判定用データが所定のクラスのデータであるか否かを学習部によって生成された所定のクラスのデータ判定用のモデルを用いて判定してもよい。
 そのような構成により、データ解析装置は、精度の高いモデルを用いて判定用データの種類を判定できる。
 また、学習部は、周波数解析された学習用データが行列変換されたデータを使用して学習処理を行ってもよい。
 そのような構成により、データ解析装置は、学習処理のアルゴリズムに適したデータを生成できる。
 また、学習処理は、ディープラーニングのアルゴリズムに従って行われてもよい。
 そのような構成により、データ解析装置は、より精度が高いモデルを学習処理で生成できる。
実施形態2.
[構成の説明]
 次に、本発明の第2の実施形態を、図面を参照して説明する。図3は、本発明による振動データ解析装置の第2の実施形態の構成例を示すブロック図である。
 本実施形態の振動データ解析装置は、振動データセットを時間で周波数解析することによってスペクトログラムを取得する。次いで、振動データ解析装置は、取得されたスペクトログラムを用いて機械学習を行うことによって異常検出モデルを生成する。
 具体的には、本実施形態の振動データ解析装置は、時間以外にも解析対象範囲や周波数等の様々な条件を用いて、振動データセットに対して網羅的に周波数解析を行う。振動データ解析装置は、各条件で周波数解析を行った後、周波数解析されたデータセットを2つにクラスタリングする。
 次いで、振動データ解析装置は、クラスタリングの最良な結果に基づいて、スペクトログラムに「正常」のラベル、または「異常」のラベルを付与する。上記の方法を用いることによって、本実施形態の振動データ解析装置は、ラベル付け作業を効率的に行いつつ、高精度の異常検出モデルを生成できる。
 図3に示すように、振動データ解析装置100は、学習用振動データ記憶部110と、振動データ学習部120と、条件記憶部130と、モデル記憶部140と、判定用振動データ記憶部150と、振動データ判定部160とを含む。
 振動データ解析装置100は、振動データを解析する装置である。振動データ解析装置100は、例えばパーソナルコンピュータ(PC)である。また、振動データ解析装置100は、サーバやスマートフォン等でもよい。
 また、振動データ解析装置100は、1つの端末で実現されてもよいし、複数の端末で実現されてもよい。例えば、振動データ学習部120と振動データ判定部160が同一端末に含まれていてもよいし、それぞれ別の端末に含まれていてもよい。
 学習用振動データ記憶部110は、機械学習に用いられる時系列データである振動データ群(時系列データセット)を記憶する機能を有する。例えば、学習用振動データ記憶部110は、対象データごとにCSV(Comma-Separated Values) ファイル形式で数値を含む時系列データを記憶する。なお、学習用振動データ記憶部110は、一般的な記憶装置である。
 図3に示すように、振動データ学習部120は、学習用周波数解析部121と、クラスタリング処理部122と、最良条件選択部123と、学習用行列変換部125と、ラベル付与部126と、学習部127とを有する。
 振動データ学習部120は、学習用振動データ記憶部110に保持されている学習用振動データを時間周波数解析する。次いで、振動データ学習部120は、時間周波数解析されたデータ(以下、時間周波数解析データという。)を用いて教師あり機械学習を行い、異常検出モデルを生成する。
 学習用周波数解析部121は、予め用意された条件群を基に時系列データセット(学習用振動データセット)を時間周波数解析することによって、時間周波数解析データを生成する機能を有する。
 周波数解析の条件は、例えば解析対象範囲、時間条件、および周波数条件の組合せである。解析対象範囲は、時間で解析対象の範囲が抽出されるための条件である。解析対象範囲は、学習用振動データにおける解析される時間範囲を指定する。
 例えば、解析対象範囲として「時間0~時間2」や「時間10~時間30」が指定される。なお、解析対象範囲は、予めユーザやシステムによって定義される。
 時間条件は、解析対象範囲で指定された範囲が解析される際の時間軸の条件である。例えば、時間条件は、4分割や8分割等の時間軸の区間分割数を示す。なお、時間条件は、予めユーザやシステムによって定義される。
 周波数条件は、解析対象範囲で指定された範囲が解析される際の周波数軸の条件である。例えば、周波数条件は、4帯域、8帯域、または12帯域等の帯域数や帯域幅を示す。すなわち、周波数条件は、周波数軸の区間分割数を示す。なお、周波数条件は、予めユーザやシステムによって定義される。
 図4は、学習用周波数解析部121による時間周波数解析処理の例を示す説明図である。図4(a)は、処理対象の学習用振動データを示す。図4(a)に示す点線の矩形内が、解析対象範囲で指定された範囲である。
 学習用周波数解析部121は、例えば解析対象範囲で指定された範囲のデータに対して、時間条件が示す区間分割数で区切られた単位ごとに高速フーリエ変換を行う。次いで、学習用周波数解析部121は、高速フーリエ変換で出力された値を基にパワー積算値を算出し、パワーベクトルを生成する。
 図4(b)は、学習用周波数解析部121が生成した時間周波数解析データが表示されたグラフを示す。横軸のPij は、区間i 、周波数帯fjにおけるパワースペクトルを意味する。縦軸は、パワースペクトルの値(パワー)である。なお、時間周波数解析の他の条件は、図4(b)の例に示す通りである。
 図4(c)は、学習用周波数解析部121が生成したパワーベクトルを示す。Tiは、区間i における時間窓長を意味する。図4(c)に示すように、パワーベクトルは、パワースペクトルで構成される。
 クラスタリング処理部122は、時間周波数解析データを基に、周波数解析の条件ごとに学習用振動データセットを正常データと異常データの2つにクラスタリングする機能を有する。
 クラスタリング処理部122が用いるクラスタリングの方式は、例えばk-means 法である。なお、クラスタリング処理部122は、k-means 法以外の方式でクラスタリングを行ってもよい。
 最良条件選択部123は、各クラスタの中心間の距離が最大になるクラスタリングモデルを最良モデルとして選択する機能を有する。最良条件選択部123は、選択されたクラスタリングモデルに対応する周波数解析の条件である最良条件を、条件記憶部130に保存する。
 最良条件選択部123は、距離算出部124を有する。距離算出部124は、各クラスタの中心間の距離を算出する機能を有する。距離算出部124は、距離として例えばユークリッド距離を算出する。なお、距離算出部124は、ユークリッド距離以外の距離を算出してもよい。
 図5は、距離算出部124による距離算出処理の例を示す説明図である。図5(a)は、処理対象の学習用振動データを示す。処理対象の学習用振動データは、D1~D20 の20個である。また、図5(b)は、学習用周波数解析部121による時間周波数解析結果である。
 図5(c)は、クラスタリング処理部122によるクラスタリングモデルの生成結果である。例えば、図5(c)の「第1条件:クラスタリング結果」は、図5(b)に示す第1条件における時間周波数解析結果をクラスタリング処理部122が白丸で表されるデータと黒丸で表されるデータにクラスタリングした結果である。
 クラスタリング処理部122によるクラスタリング結果を基に、距離算出部124は、各クラスタの中心間の距離を算出する。図5(c)に示すように、第1条件よりも第2条件の方がクラスタ間の距離が大きい。すなわち、第2条件の方がより好ましい条件である。
 学習用行列変換部125は、時間周波数解析データを学習アルゴリズムに適した形式に行列変換する機能を有する。例えば、学習部127が学習アルゴリズムとして畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を使用する場合、学習用行列変換部125は、時間周波数解析データを画像に変換する。
 図6は、学習用行列変換部125による行列変換処理の例を示す説明図である。図6に示す例では、学習用行列変換部125は、パワーベクトルをグレースケールのスペクトログラム画像に変換している。なお、Lij は、Pij が行列変換された値(輝度値)である。
 なお、図6にはパワーベクトルがグレースケール画像に変換される例が示されているが、学習用行列変換部125は、パワーベクトルをカラー画像に変換してもよい。
 ラベル付与部126は、行列変換された後の時間周波数解析データに「正常」のラベル、または「異常」のラベルを付与する機能を有する。
 学習用振動データセットには、通常異常データの方が正常データよりも少なく含まれている場合が多い。よって、「正常」のラベル、または「異常」のラベルを付与する際、ラベル付与部126は、要素が少ない方のクラスタに属するデータに「異常」のラベルを、要素が多い方のクラスタに属するデータに「正常」のラベルを付与してもよい。
 なお、ラベル付け自体は、手動で行われてもよい。手動でラベルが付与される場合、例えばクラスタの中心に位置するデータ等の代表的なデータのみが目視で確認された上で、「正常」のラベル、または「異常」のラベルがデータに付与される。
 学習部127は、ラベルが付与された行列変換された後の時間周波数解析データを用いて教師あり機械学習を行う機能を有する。教師あり機械学習を行うことによって、学習部127は、異常検出モデルを生成する。
 学習部127が行う教師あり機械学習の学習アルゴリズムは、例えば畳み込みニューラルネットワーク(CNN) 等のディープラーニングのアルゴリズムである。しかし、学習アルゴリズムは、ディープラーニングのアルゴリズム以外のアルゴリズムでもよい。
 条件記憶部130は、振動データ学習部120の最良条件選択部123が選択した時間周波数解析の最良条件を保持する機能を有する。なお、条件記憶部130は、学習用振動データ記憶部110と同様に、一般的な記憶装置である。
 モデル記憶部140は、振動データ学習部120が生成した学習済みの異常検出モデルを保持する機能を有する。なお、モデル記憶部140は、学習用振動データ記憶部110と同様に、一般的な記憶装置である。
 判定用振動データ記憶部150は、判定対象の振動データ群を記憶する機能を有する。なお、判定用振動データ記憶部150は、学習用振動データ記憶部110と同様に、一般的な記憶装置である。
 図3に示すように、振動データ判定部160は、判定用周波数解析部161と、判定用行列変換部162と、判定部163とを有する。
 振動データ判定部160は、判定用振動データ記憶部150に保持されている判定用振動データに対して時間周波数解析と行列変換を行う。次いで、振動データ判定部160は、行列変換された後の時間周波数解析データを異常検出モデルに入力することによって、判定用振動データが正常なデータであるか異常なデータであるかを判定する。
 判定用周波数解析部161は、学習用周波数解析部121と同様の機能を有する。判定用周波数解析部161は、条件記憶部130に記憶されている条件を取得し、時間周波数解析の条件として用いる。
 判定用行列変換部162は、学習用行列変換部125と同様の機能を有する。
 判定部163は、モデル記憶部140から取得した異常検出モデルに行列変換された後の時間周波数解析データを入力することによって、判定対象の判定用振動データが正常なデータであるか異常なデータであるかを判定する機能を有する。
[動作の説明]
 以下、本実施形態の振動データ解析装置100の動作を図7~図8を参照して説明する。振動データ解析装置100の動作は、学習フェーズでの動作と判定フェーズでの動作の2つに分類される。
 学習フェーズでは、振動データ解析装置100は、学習対象の振動データと正常データおよび異常データとの関係性を学習することによって、異常検出モデルを生成する。また、判定フェーズでは、振動データ解析装置100は、異常検出モデルに判定対象の振動データを入力することによって、判定対象の振動データが正常なデータであるか異常なデータであるかを判定する。
 最初に、本実施形態の振動データ解析装置100の学習フェーズでの動作を図7を参照して説明する。図7は、第2の実施形態の振動データ解析装置100による学習処理の動作を示すフローチャートである。
 最初に、振動データ学習部120は、学習用振動データ記憶部110から、学習に用いられる学習用振動データセットを取得する。振動データ学習部120は、取得された学習用振動データセットを読み込む(ステップS101)。
 次いで、振動データ学習部120は、指定された周波数解析の条件の組合せのうち、未だ周波数解析が行われていない条件の組合せを取り出す。すなわち、条件ループに入る(ステップS102)。
 次いで、振動データ学習部120は、読み込まれた学習用振動データセットのうち、未だ周波数解析が行われていない学習用振動データを取り出す。すなわち、周波数解析ループに入る(ステップS103)。
 振動データ学習部120の学習用周波数解析部121は、対象の学習用振動データを取り出された条件で時間周波数解析することによって、パワーベクトル等の時間周波数解析データを生成する(ステップS104)。なお、取り出された条件は、上述した解析対象範囲、時間条件、周波数条件等の組合せである。
 学習用周波数解析部121は、読み込まれた学習用振動データセットの中で時間周波数解析されていない学習用振動データが存在する間、ステップS104の処理を繰り返し実行する。ステップS104の処理は学習用振動データごとに、ステップS101で取得された学習用振動データの数だけ繰り返し実行される。
 取得された学習用振動データが全て時間周波数解析された時、学習用周波数解析部121は、周波数解析ループを抜ける(ステップS105)。
 次いで、振動データ学習部120のクラスタリング処理部122は、条件ごとに時間周波数解析データセットを2つにクラスタリングする(ステップS106)。
 次いで、振動データ学習部120の最良条件選択部123の距離算出部124は、各クラスタの中心間の距離L を算出する(ステップS107)。
 次いで、最良条件選択部123は、ステップS107で算出された距離L が最大値(max(L))よりも大きい場合、最大値を距離L に更新する(max(L) = L)。また、最良条件選択部123は、最良条件(解析対象範囲、時間条件、周波数条件)を、距離L が算出されたクラスタリング結果の条件に更新する(ステップS108)。
 振動データ学習部120は、指定された周波数解析の条件の組合せの中で時間周波数解析が行われていない条件の組合せが存在する間、ステップS103~ステップS108の処理を繰り返し実行する。ステップS103~ステップS108の処理は条件の組合せごとに、指定された周波数解析の条件の組合せの数だけ繰り返し実行される。
 指定された周波数解析の条件の全ての組合せで時間周波数解析が行われた時、学習用周波数解析部121は、条件ループを抜ける(ステップS109)。
 次いで、最良条件選択部123は、距離の最大値max(L)と予め設定された閾値d とを比較し、max(L)がd よりも小さいか否かを確認する(ステップS110)。なお、閾値d は、予め設定されていなくてもよい。
 max(L)がd よりも小さい場合(ステップS110におけるTrue)、最良条件選択部123は、クラスタリング失敗とみなす(ステップS111)。振動データ解析装置100は、学習処理を終了する。
 max(L)がd 以上である場合(ステップS110におけるFalse )、最良条件選択部123は、最良条件(解析対象範囲、時間条件、周波数条件)を条件記憶部130に保存する(ステップS112)。
 次いで、振動データ学習部120は、保存された最良条件での時間周波数解析データセットのうち、未だラベル付けされていない時間周波数解析データを取り出す。すなわち、ラベル付けループに入る(ステップS113)。
 振動データ学習部120の学習用行列変換部125は、対象の最良条件での時間周波数解析データを学習アルゴリズムに適した形式に行列変換する(ステップS114)。
 次いで、振動データ学習部120のラベル付与部126は、最良条件に対応するクラスタリングモデル(クラスタリング結果)を用いて、行列変換されたデータを分類する。次いで、ラベル付与部126は、分類されたデータに「正常」のラベル、または「異常」のラベルを付与する(ステップS115)。
 振動データ学習部120は、時間周波数解析データセットの中でラベル付けされていない時間周波数解析データが存在する間、ステップS114~ステップS115の処理を繰り返し実行する。ステップS114~ステップS115の処理は時間周波数解析データごとに、ステップS101で取得された学習用振動データの数だけ繰り返し実行される。
 全ての時間周波数解析データに対してラベルが付与された時、振動データ学習部120は、ラベル付けループを抜ける(ステップS116)。
 次いで、学習部127は、ステップS115でラベルが付与された学習用振動データセット(行列変換された後の時間周波数解析データセット)を用いて、教師あり機械学習を行う(ステップS117)。教師あり機械学習を行うことによって、学習部127は、異常検出モデルを生成する。
 次いで、学習部127は、ステップS117で生成された異常検出モデルをモデル記憶部140に保存する(ステップS118)。保存した後、振動データ解析装置100は、学習処理を終了する。
 なお、上記の例では、学習部127は、クラスタ間の距離が最大のクラスタリングモデルを自動的に最良モデルとして採用している。しかし、最良条件選択部123が距離が大きい順にクラスタリングモデル候補を学習用行列変換部125に入力し、学習部127が複数のモデルの中から最良なモデルを選択してもよい。
 次いで、本実施形態の振動データ解析装置100の判定フェーズでの動作を図8を参照して説明する。図8は、第2の実施形態の振動データ解析装置100による判定処理の動作を示すフローチャートである。
 最初に、振動データ判定部160は、モデル記憶部140から学習部127により生成された異常検出モデルを読み込む(ステップS121)。
 次いで、振動データ判定部160は、判定用振動データ記憶部150から、判定用振動データセットを取得する。振動データ判定部160は、取得された判定用振動データセットを読み込む(ステップS122)。
 次いで、振動データ判定部160は、条件記憶部130から最良条件選択部123により選択された最良条件を読み込む(ステップS123)。
 次いで、振動データ判定部160は、読み込まれた判定用振動データセットのうち、未だ判定されていない判定用振動データを取り出す。すなわち、判定ループに入る(ステップS124)。
 振動データ判定部160の判定用周波数解析部161は、対象の判定用振動データをステップS123で読み込まれた最良条件(解析対象範囲、時間条件、周波数条件)で時間周波数解析することによって、パワーベクトル等の時間周波数解析データを生成する(ステップS125)。なお、時間周波数解析処理は、学習フェーズのステップS104の処理と同様である。
 次いで、振動データ判定部160の判定用行列変換部162は、時間周波数解析データを行列変換する(ステップS126)。なお、行列変換処理は、学習フェーズのステップS114の処理と同様である。
 次いで、振動データ判定部160の判定部163は、ステップS121で読み込まれた異常検出モデルにステップS126で行列変換された時間周波数解析データを入力することによって、対象の判定用振動データが正常なデータであるか、異常なデータであるかを判定する(ステップS127)。
 振動データ判定部160は、判定用振動データセットの中で判定されていない判定用振動データが存在する間、ステップS125~ステップS127の処理を繰り返し実行する。ステップS125~ステップS127の処理は判定用振動データごとに、ステップS122で取得された判定用振動データの数だけ繰り返し実行される。
 全ての判定用振動データが判定された時、振動データ判定部160は、判定ループを抜ける(ステップS128)。判定ループを抜けた後、振動データ解析装置100は、判定処理を終了する。以上の処理により、振動データ解析装置100は、振動データが正常なデータであるか、異常なデータであるかを判定できる。
[効果の説明]
 本実施形態の振動データ学習部120の学習用周波数解析部121は、時系列データの集合である振動データセットを様々な条件(解析対象範囲、周波数、時間等)で周波数解析する。
 クラスタリング処理部122は、条件ごとに、周波数解析データを基に各学習用振動データを2つにクラスタリングする。次いで、最良条件選択部123は、最良なクラスタリングモデルを選択する。
 次いで、学習用行列変換部125は、学習アルゴリズムに合わせて周波数解析データを行列変換する。次いで、ラベル付与部126は、選択された最良なクラスタリングモデルを用いて、行列変換された周波数解析データに「正常」のラベル、または「異常」のラベルを付与する。
 次いで、学習部127は、ラベルが付与されたデータを用いて機械学習を行い、異常検出モデルを生成する。以上の構成により、本実施形態の振動データ学習部120は、ラベル付け作業を効率的に実行できる。すなわち、ラベル付けに掛かる工数が削減される。
 また、学習部127が正常なデータであるか異常なデータであるかの判断要素として、解析対象範囲、時間、および周波数等の組合せに従って抽出された特徴的な部分を学習するため、生成される異常検出モデルの精度が向上する。
 また、本実施形態の振動データ判定部160は、異常な振動データを検出できる。さらに、学習部127がディープラーニングが用いられる教師あり学習を行うことによって、判定部163は、クラスタリングだけが実行される場合よりも細かな特徴を掴んだ上で判定用振動データを判定できる。
実施形態3.
[構成の説明]
 次に、本発明の第3の実施形態を、図面を参照して説明する。図9は、本発明による振動データ解析装置の第3の実施形態の構成例を示すブロック図である。
 本実施形態の振動データ解析装置101の構成は、最良条件選択部123が距離算出部124の代わりに不正率算出部128を有する点以外、第2の実施形態の振動データ解析装置100の構成と同様である。
 本実施形態の学習用振動データ記憶部110に保存されている学習用振動データセットの中には、予め「正常」のラベル、または「異常」のラベルが付与されている振動データが含まれている。振動データ学習部120は、ラベルが付与されている学習用振動データを抽出する。
 本実施形態の不正率算出部128は、同一ラベルが付与されたデータが同一クラスタにグルーピングされていない度合いを示す不正率を算出する。本実施形態の最良条件選択部123は、クラスタ間の距離が最大になる条件の組合せではなく、算出された不正率が最低になる条件の組合せを最良の条件として選択する。
 例えば、「正常」のラベルが付与された振動データがM個、「異常」のラベルが付与された振動データがN個それぞれ抽出された場合を考える。「正常」の振動データが全て同一クラスタに存在し、「異常」の振動データが全て「正常」の振動データが存在するクラスタとは別のクラスタに存在する場合、不正率算出部128は、不正率を「0」と算出する。
 また、「正常」の振動データがm個、「異常」の振動データがn個それぞれ想定されたクラスタとは異なるクラスタにグルーピングされた場合、不正率算出部128は、例えば不正率を「(m/M)+(n/N)」と算出する。なお、不正率算出部128は、同一ラベルが付与されたデータが同一クラスタにグルーピングされていない度合いを示すのであれば不正率をどのような方法で算出してもよい。
 なお、本実施形態の最良条件選択部123は、算出された不正率が閾値d よりも大きい場合にクラスタリングが失敗したと判断してもよい。
[動作の説明]
 以下、本実施形態の振動データ解析装置101の学習フェーズでの動作を図10を参照して説明する。図10は、第3の実施形態の振動データ解析装置101による学習処理の動作を示すフローチャートである。
 なお、本実施形態の振動データ解析装置101の判定フェーズでの動作は、図8に示す判定処理の動作と同様である。
 最初に、振動データ学習部120は、学習用振動データ記憶部110から、学習に用いられるラベルが付与された学習用振動データセットを取得する。振動データ学習部120は、取得された学習用振動データセットを読み込む(ステップS201)。
 ステップS202~ステップS206の処理は、図7に示すステップS102~ステップS106の処理と同様である。
 次いで、振動データ学習部120の最良条件選択部123の不正率算出部128は、クラスタリング結果の不正率W を算出する(ステップS207)。
 次いで、最良条件選択部123は、ステップS207で算出された不正率W が最小値(min(W))よりも小さい場合、最小値を不正率W に更新する(min(W) = W)。また、最良条件選択部123は、最良条件(解析対象範囲、時間条件、周波数条件)を、不正率W が算出されたクラスタリング結果の条件に更新する(ステップS208)。
 ステップS209の処理は、図7に示すステップS109の処理と同様である。
 次いで、最良条件選択部123は、不正率の最小値min(W)と予め設定された閾値d とを比較し、min(W)がd よりも大きいか否かを確認する(ステップS210)。なお、閾値d は、予め設定されていなくてもよい。
 min(W)がd よりも大きい場合(ステップS210におけるTrue)、最良条件選択部123は、クラスタリング失敗とみなす(ステップS211)。振動データ解析装置100は、学習処理を終了する。
 min(W)がd 以下である場合(ステップS210におけるFalse )、最良条件選択部123は、最良条件(解析対象範囲、時間条件、周波数条件)を条件記憶部130に保存する(ステップS212)。
 ステップS213~ステップS218の処理は、図7に示すステップS113~ステップS118の処理と同様である。
[効果の説明]
 本実施形態の振動データ解析装置101は、クラスタリング処理部122が事前に正しいラベルが付与された振動データを用いてクラスタリングを行い、最良条件選択部123がクラスタリング結果を基に最良条件を選択するため、生成される異常検出モデルの精度を向上させることができる。
 各実施形態の振動データ解析装置は、工作機械の故障検知の分野等で好適に利用されることが期待される。
 なお、各実施形態のデータ解析装置10、振動データ解析装置100、および振動データ解析装置101は、例えば、非一時的な記憶媒体に格納されているプログラムに従って処理を実行するCPU(Central Processing Unit)によって実現されてもよい。すなわち、周波数解析部11、クラスタ分析部12、算出部13、選択部14、学習用周波数解析部121、クラスタリング処理部122、最良条件選択部123、学習用行列変換部125、ラベル付与部126、学習部127、判定用周波数解析部161、判定用行列変換部162、および判定部163は、例えば、プログラム制御に従って処理を実行するCPU によって実現されてもよい。
 また、学習用振動データ記憶部110、条件記憶部130、モデル記憶部140、および判定用振動データ記憶部150は、例えばRAM(Random Access Memory) で実現されてもよい。
 また、各実施形態のデータ解析装置10、振動データ解析装置100、および振動データ解析装置101における各部は、ハードウェア回路によって実現されてもよい。一例として、周波数解析部11、クラスタ分析部12、算出部13、選択部14、学習用振動データ記憶部110、学習用周波数解析部121、クラスタリング処理部122、最良条件選択部123、学習用行列変換部125、ラベル付与部126、学習部127、条件記憶部130、モデル記憶部140、判定用振動データ記憶部150、判定用周波数解析部161、判定用行列変換部162、および判定部163が、それぞれLSI(Large Scale Integration)で実現される。また、それらが1つのLSI で実現されていてもよい。
 以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 この出願は、2017年3月28日に出願された日本特許出願2017-062119を基礎とする優先権を主張し、その開示の全てをここに取り込む。
10 データ解析装置
100、101 振動データ解析装置
11 周波数解析部
12 クラスタ分析部
13 算出部
14 選択部
110 学習用振動データ記憶部
120 振動データ学習部
121 学習用周波数解析部
122 クラスタリング処理部
123 最良条件選択部
124 距離算出部
125 学習用行列変換部
126 ラベル付与部
127 学習部
128 不正率算出部
130 条件記憶部
140 モデル記憶部
150 判定用振動データ記憶部
160 振動データ判定部
161 判定用周波数解析部
162 判定用行列変換部
163 判定部

Claims (10)

  1.  データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを前記学習用データごとに所定の条件で周波数解析する周波数解析部と、
     周波数解析された学習用データを前記周波数解析された学習用データのクラスの数にクラスタリングするクラスタ分析部と、
     各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出する算出部と、
     前記周波数解析部が複数の条件で複数のクラスの学習用データをそれぞれ周波数解析した時に算出された複数の度合いのうち最小の度合いが算出された時の前記クラスタ分析部によるクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する選択部とを備える
     ことを特徴とするデータ解析装置。
  2.  選択されたクラスタリングモデルを使用して学習処理を行うことによって所定のクラスのデータ判定用のモデルを生成する学習部を備える
     請求項1記載のデータ解析装置。
  3.  選択されたクラスタリングモデルに対応する条件を記憶する記憶部を備える
     請求項2記載のデータ解析装置。
  4.  判定用データが所定のクラスのデータであるか否かを判定する判定部を備え、
     周波数解析部は、判定用データを記憶部に記憶されている条件で周波数解析し、
     前記判定部は、周波数解析された判定用データが所定のクラスのデータであるか否かを学習部によって生成された所定のクラスのデータ判定用のモデルを用いて判定する
     請求項3記載のデータ解析装置。
  5.  学習部は、周波数解析された学習用データが行列変換されたデータを使用して学習処理を行う
     請求項2から請求項4のうちのいずれか1項に記載のデータ解析装置。
  6.  学習処理は、ディープラーニングのアルゴリズムに従って行われる
     請求項1から請求項5のうちのいずれか1項に記載のデータ解析装置。
  7.  データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを前記学習用データごとに所定の条件で周波数解析し、
     周波数解析された学習用データを前記周波数解析された学習用データのクラスの数にクラスタリングし、
     各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出し、
     複数の条件で複数のクラスの学習用データがそれぞれ周波数解析された時に算出された複数の度合いのうち最小の度合いが算出された時のクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する
     ことを特徴とするデータ解析方法。
  8.  選択されたクラスタリングモデルを使用して学習処理を行うことによって所定のクラスのデータ判定用のモデルを生成する
     請求項7記載のデータ解析方法。
  9.  コンピュータに、
     データのクラスを示すラベルが一部付与された複数のクラスの学習用データを含む複数の学習用データを前記学習用データごとに所定の条件で周波数解析する周波数解析処理、
     周波数解析された学習用データを前記周波数解析された学習用データのクラスの数にクラスタリングするクラスタ分析処理、
     各クラスタを基に同一ラベルが付与された周波数解析された学習用データが同一クラスタに含まれていない度合いを算出する算出処理、および
     複数の条件で複数のクラスの学習用データがそれぞれ周波数解析された時に算出された複数の度合いのうち最小の度合いが算出された時のクラスタリング結果を学習用データにラベルを付与するためのクラスタリングモデルとして選択する選択処理
     を実行させるためのデータ解析プログラム。
  10.  コンピュータに、
     選択されたクラスタリングモデルを使用して学習処理を行うことによって所定のクラスのデータ判定用のモデルを生成する生成処理を実行させる
     請求項9記載のデータ解析プログラム。
PCT/JP2018/008007 2017-03-28 2018-03-02 データ解析装置、データ解析方法およびデータ解析プログラム WO2018180197A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US16/495,145 US11593299B2 (en) 2017-03-28 2018-03-02 Data analysis device, data analysis method and data analysis program
CN201880022162.1A CN110476158A (zh) 2017-03-28 2018-03-02 数据分析设备、数据分析方法和数据分析程序
JP2019509052A JP6828807B2 (ja) 2017-03-28 2018-03-02 データ解析装置、データ解析方法およびデータ解析プログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-062119 2017-03-28
JP2017062119 2017-03-28

Publications (1)

Publication Number Publication Date
WO2018180197A1 true WO2018180197A1 (ja) 2018-10-04

Family

ID=63675493

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/008007 WO2018180197A1 (ja) 2017-03-28 2018-03-02 データ解析装置、データ解析方法およびデータ解析プログラム

Country Status (4)

Country Link
US (1) US11593299B2 (ja)
JP (1) JP6828807B2 (ja)
CN (1) CN110476158A (ja)
WO (1) WO2018180197A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020119154A (ja) * 2019-01-22 2020-08-06 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
JP2020140499A (ja) * 2019-02-28 2020-09-03 富士通株式会社 付与方法、付与プログラム及び付与装置
WO2021095142A1 (ja) * 2019-11-12 2021-05-20 三菱電機株式会社 故障予測装置、学習装置、および学習方法
WO2022249266A1 (ja) * 2021-05-25 2022-12-01 日本電気株式会社 不正検知システム、不正検知方法およびプログラム記録媒体
KR20230021965A (ko) * 2021-08-06 2023-02-14 동의대학교 산학협력단 데이터 분석 알고리즘 기반 신발 밑창의 마모 상태 안내 시스템 및 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7134845B2 (ja) * 2018-11-21 2022-09-12 株式会社日立製作所 分析支援装置、分析支援方法、および分析支援プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005115569A (ja) * 2003-10-06 2005-04-28 Matsushita Electric Works Ltd 信号識別装置および信号識別方法
JP2006072659A (ja) * 2004-09-01 2006-03-16 Matsushita Electric Works Ltd 信号識別方法および信号識別装置
JP2008181294A (ja) * 2007-01-24 2008-08-07 Sony Corp 情報処理装置および方法、並びにプログラム
WO2015182317A1 (ja) * 2014-05-29 2015-12-03 株式会社 日立メディコ X線管故障予兆検知装置、x線管故障予兆検知方法およびx線撮像装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MXPA03009357A (es) 2001-04-13 2004-02-18 Dolby Lab Licensing Corp Escalamiento en el tiempo y escalamiento en el tono de alta calidad de senales de audio.
JP4356716B2 (ja) 2006-08-03 2009-11-04 パナソニック電工株式会社 異常監視装置
JP4003086B2 (ja) 2006-08-07 2007-11-07 日本精工株式会社 評価方法及び装置
JP4762088B2 (ja) 2006-08-31 2011-08-31 株式会社東芝 プロセス異常診断装置
JP2009146149A (ja) 2007-12-13 2009-07-02 Panasonic Electric Works Co Ltd 信号識別方法及び信号識別装置
JP2010117336A (ja) 2008-11-13 2010-05-27 Yec:Kk 異音判定ツール
US9916538B2 (en) * 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
CA2925021A1 (en) * 2013-11-01 2015-05-07 Curevac Ag Modified rna with decreased immunostimulatory properties
US20220005291A1 (en) * 2014-05-20 2022-01-06 State Farm Mutual Automobile Insurance Company Autonomous vehicle operation feature monitoring and evaluation of effectiveness
JP6435740B2 (ja) 2014-09-22 2018-12-12 日本電気株式会社 データ処理システム、データ処理方法およびデータ処理プログラム
JP6511950B2 (ja) 2015-05-14 2019-05-15 株式会社リコー 画像処理装置、画像処理方法及びプログラム
US10460251B2 (en) * 2015-06-19 2019-10-29 Preferred Networks Inc. Cross-domain time series data conversion apparatus, methods, and systems
US10817065B1 (en) * 2015-10-06 2020-10-27 Google Llc Gesture recognition using multiple antenna
US10621744B1 (en) * 2015-12-11 2020-04-14 State Farm Mutual Automobile Insurance Company Structural characteristic extraction from 3D images
US10410113B2 (en) * 2016-01-14 2019-09-10 Preferred Networks, Inc. Time series data adaptation and sensor fusion systems, methods, and apparatus

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005115569A (ja) * 2003-10-06 2005-04-28 Matsushita Electric Works Ltd 信号識別装置および信号識別方法
JP2006072659A (ja) * 2004-09-01 2006-03-16 Matsushita Electric Works Ltd 信号識別方法および信号識別装置
JP2008181294A (ja) * 2007-01-24 2008-08-07 Sony Corp 情報処理装置および方法、並びにプログラム
WO2015182317A1 (ja) * 2014-05-29 2015-12-03 株式会社 日立メディコ X線管故障予兆検知装置、x線管故障予兆検知方法およびx線撮像装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020119154A (ja) * 2019-01-22 2020-08-06 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
JP7313828B2 (ja) 2019-01-22 2023-07-25 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
JP2020140499A (ja) * 2019-02-28 2020-09-03 富士通株式会社 付与方法、付与プログラム及び付与装置
JP7249580B2 (ja) 2019-02-28 2023-03-31 富士通株式会社 付与方法、付与プログラム及び付与装置
WO2021095142A1 (ja) * 2019-11-12 2021-05-20 三菱電機株式会社 故障予測装置、学習装置、および学習方法
JPWO2021095142A1 (ja) * 2019-11-12 2021-05-20
JP7275305B2 (ja) 2019-11-12 2023-05-17 三菱電機株式会社 故障予測装置、学習装置、および学習方法
WO2022249266A1 (ja) * 2021-05-25 2022-12-01 日本電気株式会社 不正検知システム、不正検知方法およびプログラム記録媒体
KR20230021965A (ko) * 2021-08-06 2023-02-14 동의대학교 산학협력단 데이터 분석 알고리즘 기반 신발 밑창의 마모 상태 안내 시스템 및 방법
KR102582839B1 (ko) * 2021-08-06 2023-09-25 동의대학교 산학협력단 데이터 분석 알고리즘 기반 신발 밑창의 마모 상태 안내 시스템 및 방법

Also Published As

Publication number Publication date
JPWO2018180197A1 (ja) 2020-01-23
CN110476158A (zh) 2019-11-19
US11593299B2 (en) 2023-02-28
JP6828807B2 (ja) 2021-02-10
US20200019855A1 (en) 2020-01-16

Similar Documents

Publication Publication Date Title
JP6828807B2 (ja) データ解析装置、データ解析方法およびデータ解析プログラム
US11216741B2 (en) Analysis apparatus, analysis method, and non-transitory computer readable medium
Bazan et al. Stator short-circuit diagnosis in induction motors using mutual information and intelligent systems
US10832698B2 (en) Abnormal sound detection device and abnormal sound detection method
EP3552067B1 (en) Methods and systems for discovery of prognostic subsequences in time series
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
US12007745B2 (en) Apparatus for predicting equipment damage
JP2015170121A (ja) 異常診断装置及びプログラム
KR20180039205A (ko) 개선된 RTC(Real-time contrasts) 기법을 이용한 지능형 이상 진단 방법 및 장치
KR102079359B1 (ko) 개선된 sax 기법 및 rtc 기법을 이용한 공정 모니터링 장치 및 방법
JP2020042519A (ja) 異常検知装置、異常検知方法、及び異常検知プログラム
CN112926642A (zh) 一种多源域自适应智能机械故障诊断方法及系统
JP2019105871A (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
JP6366852B2 (ja) 機器分類装置
Bator et al. Feature extraction and reduction applied to sensorless drive diagnosis
US11954131B2 (en) Time-series data processing method
JP7251955B2 (ja) 検出装置及び機械学習方法
KR102187344B1 (ko) 결정 트리를 이용한 반려동물 진단 방법 및 장치
JP6641056B1 (ja) 機器の異常診断方法および機器の異常診断システム
KR102017162B1 (ko) 원전설비의 예측 진단 방법 및 시스템
JP7028259B2 (ja) 分析装置、分析方法、及び、プログラム
JP2019160072A (ja) 情報処理装置、情報処理方法、及びプログラム
JP6961126B1 (ja) 劣化検知装置
JP7028260B2 (ja) 分析システム、分析方法、及び、プログラム
Doseděl et al. Comparison of Performance of Machine Learning Methods for Bearing Faults Classification Using Time-Domain Features

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18776893

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019509052

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18776893

Country of ref document: EP

Kind code of ref document: A1