JP2020107138A - Classification device, classification system, classification method and program - Google Patents
Classification device, classification system, classification method and program Download PDFInfo
- Publication number
- JP2020107138A JP2020107138A JP2018246147A JP2018246147A JP2020107138A JP 2020107138 A JP2020107138 A JP 2020107138A JP 2018246147 A JP2018246147 A JP 2018246147A JP 2018246147 A JP2018246147 A JP 2018246147A JP 2020107138 A JP2020107138 A JP 2020107138A
- Authority
- JP
- Japan
- Prior art keywords
- data
- teacher
- area
- evaluation
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 239000011159 matrix material Substances 0.000 claims abstract description 199
- 238000011156 evaluation Methods 0.000 claims abstract description 166
- 238000012545 processing Methods 0.000 claims abstract description 86
- 238000013145 classification model Methods 0.000 claims abstract description 40
- 238000000605 extraction Methods 0.000 claims abstract description 19
- 238000000926 separation method Methods 0.000 claims description 93
- 230000010365 information processing Effects 0.000 description 40
- 239000013598 vector Substances 0.000 description 33
- 230000006870 function Effects 0.000 description 19
- 238000004891 communication Methods 0.000 description 14
- 238000005259 measurement Methods 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 13
- 230000014509 gene expression Effects 0.000 description 9
- 239000000284 extract Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 239000010749 BS 2869 Class C1 Substances 0.000 description 5
- 239000010750 BS 2869 Class C2 Substances 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 5
- 239000000047 product Substances 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000010079 rubber tapping Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000036760 body temperature Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N29/00—Investigating or analysing materials by the use of ultrasonic, sonic or infrasonic waves; Visualisation of the interior of objects by transmitting ultrasonic or sonic waves through the object
- G01N29/04—Analysing solids
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N29/00—Investigating or analysing materials by the use of ultrasonic, sonic or infrasonic waves; Visualisation of the interior of objects by transmitting ultrasonic or sonic waves through the object
- G01N29/44—Processing the detected response signal, e.g. electronic circuits specially adapted therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/0308—Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Multimedia (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Human Computer Interaction (AREA)
- Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)
Abstract
Description
本発明は、分類装置、分類システム、分類方法及びプログラムに関する。 The present invention relates to a classification device, a classification system, a classification method and a program.
従来、センシングにより得られた信号等の連続的に発生する時系列データの一例である音響信号等のデータを解析、分類するために、非負値行列因子分解を用いる技術が研究されている(下記特許文献1〜4、下記非特許文献1,2)。 Conventionally, a technique using non-negative matrix factorization has been researched in order to analyze and classify data such as acoustic signals, which is an example of continuously generated time series data such as signals obtained by sensing (see below. Patent Documents 1 to 4 and Non-Patent Documents 1 and 2 below.
上述のような解析、分類のための技術は、時系列データを解析、分類することができるが、近年、解析、分類する精度をより高めることが強く求められるようになってきている。さらに上述のような要求と同時に、処理時間の増加及び処理装置の負担を避けるために、上述のような解析、分類のための処理において、処理量(処理データ量)をより抑制することが求められている。 The techniques for analysis and classification as described above can analyze and classify time-series data, but in recent years, it has been strongly demanded to further improve the accuracy of analysis and classification. Further, at the same time as the above request, in order to avoid an increase in processing time and a burden on the processing device, it is required to further reduce the processing amount (processing data amount) in the above-described analysis and classification processing. Has been.
そこで、本発明は、上記状況に鑑みてなされたものであり、本発明の目的とするところは、処理量の増加をより抑制しつつ、分類の精度をより向上させることが可能な、新規且つ改良された分類装置、分類システム、分類方法及びプログラムを提供することにある。 Therefore, the present invention has been made in view of the above situation, and an object of the present invention is to further suppress the increase in the processing amount and further improve the accuracy of classification, which is new and An object of the present invention is to provide an improved classification device, classification system, classification method and program.
上記課題を解決するために、本発明のある観点によれば、時系列データを目的とする第1のクラスに分類する分類装置であって、少なくとも周波数領域又は時間領域において表現された前記時系列データから、所定のデータ領域の非負の評価データを取得する処理部と、前記所定のデータ領域に対応する非負の第1の教師データに対して非負値行列因子分解を行うことで生成された教師係数行列、及び、前記第1の教師データに対応付けられた前記第1のクラスに基づいて生成された分類モデルパラメータを格納する記憶部と、前記第1の教師データに対して非負値行列因子分解を行うことで生成された教師基底行列に基づいて、前記評価データから評価係数行列を生成する特徴抽出部と、
算出された前記評価係数行列を、前記分類モデルパラメータに基づいて、前記第1のクラスに分類する分類部と、前記所定のデータ領域を特定する領域特定部とを備え、前記領域特定部は、前記第1のクラスのそれぞれに対応付けられた非負の各第2の教師データを、周波数領域又は時間領域においてそれぞれ分割し、分割された領域ごとの前記各第2の教師データの観測行列に基づいて、前記分割された領域ごとの前記第1のクラス間の分離度を示す第1の評価指標を算出し、目的としない第2のクラスのそれぞれに対応付けられた非負の各第3の教師データを、周波数領域又は時間領域においてそれぞれ分割し、分割された領域ごとの前記各第3の教師データの観測行列に基づいて、前記分割された領域ごとの前記第2のクラス間の分離度を示す第2の評価指標を算出し、前記第1の評価指標が予め設定された第1の閾値よりも高い、前記分割された領域を抽出することにより、第1の領域を特定し、前記第2の評価指標が予め設定された第2の閾値よりも高い、前記分割された領域を抽出することにより、第2の領域を特定し、特定した前記第1及び第2の領域に基づいて、前記所定のデータ領域を特定する、分類装置が提供される。
In order to solve the above problems, according to an aspect of the present invention, there is provided a classification device for classifying time series data into an intended first class, wherein the time series represented at least in a frequency domain or a time domain. A processing unit for acquiring non-negative evaluation data of a predetermined data area from data, and a teacher generated by performing non-negative matrix factorization on the non-negative first teacher data corresponding to the predetermined data area. A storage unit for storing a coefficient matrix and a classification model parameter generated based on the first class associated with the first teacher data; and a non-negative matrix factor for the first teacher data. A feature extraction unit that generates an evaluation coefficient matrix from the evaluation data, based on the teacher basis matrix generated by performing decomposition,
The calculated evaluation coefficient matrix, based on the classification model parameter, a classification unit that classifies into the first class, and a region specifying unit that specifies the predetermined data region, the region specifying unit, Each non-negative second teacher data associated with each of the first classes is divided in the frequency domain or the time domain, and based on the observation matrix of each second teacher data for each divided area. Calculating a first evaluation index indicating the degree of separation between the first classes for each of the divided regions, and assigning each non-negative third teacher associated with each of the second classes not intended. The data is divided in the frequency domain or the time domain, and the degree of separation between the second classes for each divided area is calculated based on the observation matrix of each of the third teacher data for each divided area. The second evaluation index shown is calculated, and the first area is specified by extracting the divided area in which the first evaluation index is higher than a preset first threshold value. 2 evaluation index is higher than a preset second threshold value, the second area is specified by extracting the divided area, and based on the specified first and second areas, A classification device is provided that identifies the predetermined data area.
また、上記課題を解決するために、本発明の別の観点によれば、時系列データを目的とする第1のクラスに分類する分類装置と、前記時系列データを取得するセンサとを含む分類システムであって、前記分類装置は、少なくとも周波数領域又は時間領域において表現された前記時系列データから、所定のデータ領域の非負の評価データを取得する処理部と、前記所定のデータ領域に対応する非負の第1の教師データに対して非負値行列因子分解を行うことで生成された教師係数行列、及び、前記第1の教師データに対応付けられた前記第1のクラスに基づいて生成された分類モデルパラメータを格納する記憶部と、前記第1の教師データに対して非負値行列因子分解を行うことで生成された教師基底行列に基づいて、前記評価データから評価係数行列を生成する特徴抽出部と、算出された前記評価係数行列を、前記分類モデルパラメータに基づいて、前記第1のクラスに分類する分類部と、前記所定のデータ領域を特定する領域特定部とを有し、前記領域特定部は、前記第1のクラスのそれぞれに対応付けられた非負の各第2の教師データを、周波数領域又は時間領域においてそれぞれ分割し、分割された領域ごとの前記各第2の教師データの観測行列に基づいて、前記分割された領域ごとの前記第1のクラス間の分離度を示す第1の評価指標を算出し、目的としない第2のクラスのそれぞれに対応付けられた非負の各第3の教師データを、周波数領域又は時間領域においてそれぞれ分割し、分割された領域ごとの前記各第3の教師データの観測行列に基づいて、前記分割された領域ごとの前記第2のクラス間の分離度を示す第2の評価指標を算出し、前記第1の評価指標が予め設定された第1の閾値よりも高い、前記分割された領域を抽出することにより、第1の領域を特定し、前記第2の評価指標が予め設定された第2の閾値よりも高い、前記分割された領域を抽出することにより、第2の領域を特定し、特定した前記第1及び第2の領域に基づいて、前記所定のデータ領域を特定する、分類システムが提供される。 In order to solve the above-mentioned problems, according to another aspect of the present invention, a classification including a classification device that classifies time-series data into an intended first class and a sensor that acquires the time-series data. In the system, the classification device corresponds to the processing unit that acquires non-negative evaluation data of a predetermined data region from the time series data represented in at least the frequency domain or the time domain, and the predetermined data region. It is generated based on a teacher coefficient matrix generated by performing non-negative matrix factorization on the non-negative first teacher data, and the first class associated with the first teacher data. Feature extraction for generating an evaluation coefficient matrix from the evaluation data based on a storage unit that stores a classification model parameter and a teacher basis matrix generated by performing non-negative matrix factorization on the first teacher data A region, a classification unit that classifies the calculated evaluation coefficient matrix into the first class based on the classification model parameter, and a region specifying unit that specifies the predetermined data region. The specifying unit divides each non-negative second teacher data associated with each of the first classes in a frequency domain or a time domain, and divides each second teacher data of each of the divided areas. A first evaluation index indicating the degree of separation between the first classes for each of the divided regions is calculated based on an observation matrix, and each non-negative value associated with each of the second classes not intended The third teacher data is divided in the frequency domain or the time domain, and based on the observation matrix of each of the third teacher data for each divided area, the second class between the divided areas is divided. A second evaluation index indicating the degree of separation of the first area, and the first area is identified by extracting the divided area in which the first evaluation index is higher than a preset first threshold value. Then, the second area is specified by extracting the divided area in which the second evaluation index is higher than a preset second threshold value, and the specified first and second areas A classification system is provided for identifying the predetermined data area based on
上記課題を解決するために、本発明の更なる別の観点によれば、時系列データを目的とする第1のクラスに分類する分類方法であって、少なくとも周波数領域又は時間領域において表現された前記時系列データから、所定のデータ領域の非負の評価データを取得することと、前記所定のデータ領域に対応する非負の第1の教師データに対して非負値行列因子分解を行うことで生成された教師係数行列、及び、前記第1の教師データに対応付けられた前記第1のクラスに基づいて生成された分類モデルパラメータを格納することと、前記第1の教師データに対して非負値行列因子分解を行うことで生成された教師基底行列に基づいて、前記評価データから評価係数行列を生成することと、算出された前記評価係数行列を、前記分類モデルパラメータに基づいて、前記第1のクラスに分類することと、前記所定のデータ領域を特定することとを含み、前記所定のデータ領域を特定することは、前記第1のクラスのそれぞれに対応付けられた非負の各第2の教師データを、周波数領域又は時間領域においてそれぞれ分割し、分割された領域ごとの前記各第2の教師データの観測行列に基づいて、前記分割された領域ごとの前記第1のクラス間の分離度を示す第1の評価指標を算出し、目的としない第2のクラスのそれぞれに対応付けられた非負の各第3の教師データを、周波数領域又は時間領域においてそれぞれ分割し、分割された領域ごとの前記各第3の教師データの観測行列に基づいて、前記分割された領域ごとの前記第2のクラス間の分離度を示す第2の評価指標を算出し、前記第1の評価指標が予め設定された第1の閾値よりも高い、前記分割された領域を抽出することにより、第1の領域を特定し、前記第2の評価指標が予め設定された第2の閾値よりも高い、前記分割された領域を抽出することにより、第2の領域を特定し、特定した前記第1及び第2の領域に基づいて、前記所定のデータ領域を特定することを有する、分類方法が提供される。 In order to solve the above-mentioned problems, according to still another aspect of the present invention, there is provided a classification method for classifying time series data into a desired first class, which is expressed in at least a frequency domain or a time domain. It is generated by acquiring non-negative evaluation data of a predetermined data area from the time series data and performing non-negative matrix factorization on the non-negative first teacher data corresponding to the predetermined data area. A training coefficient matrix, and a classification model parameter generated based on the first class associated with the first training data, and a non-negative matrix for the first training data. Generating an evaluation coefficient matrix from the evaluation data based on a teacher basis matrix generated by performing factorization, and calculating the calculated evaluation coefficient matrix based on the classification model parameter. Classifying into a class and identifying the predetermined data area, wherein identifying the predetermined data area is performed by each non-negative second teacher associated with each of the first classes. The data is divided in the frequency domain or the time domain, and the degree of separation between the first classes of the divided areas is calculated based on the observation matrix of the second teacher data of the divided areas. The first evaluation index shown is calculated, and each non-negative third teacher data associated with each second target class is divided in the frequency domain or the time domain. A second evaluation index indicating the degree of separation between the second classes for each of the divided regions is calculated based on the observation matrix of each of the third teacher data, and the first evaluation index is set in advance. By dividing the divided area having a higher threshold value than the predetermined first threshold value to identify the first area, and the second evaluation index being higher than a preset second threshold value. A classification method is provided that includes identifying a second area by extracting the identified area and identifying the predetermined data area based on the identified first and second areas.
上記課題を解決するために、本発明の更なる別の観点によれば、時系列データを目的とする第1のクラスに分類するためのプログラムであって、コンピュータに、少なくとも周波数領域又は時間領域において表現された前記時系列データから、所定のデータ領域の非負の評価データを取得する機能と、前記所定のデータ領域に対応する非負の第1の教師データに対して非負値行列因子分解を行うことで生成された教師係数行列、及び、前記第1の教師データに対応付けられた前記第1のクラスに基づいて生成された分類モデルパラメータを格納する機能と、前記第1の教師データに対して非負値行列因子分解を行うことで生成された教師基底行列に基づいて、前記評価データから評価係数行列を生成する機能と、算出された前記評価係数行列を、前記分類モデルパラメータに基づいて、前記第1のクラスに分類する機能と、前記所定のデータ領域を特定する機能とを実現させ、前記所定のデータ領域を特定する機能においては、前記第1のクラスのそれぞれに対応付けられた非負の各第2の教師データを、周波数領域又は時間領域においてそれぞれ分割し、分割された領域ごとの前記各第2の教師データの観測行列に基づいて、前記分割された領域ごとの前記第1のクラス間の分離度を示す第1の評価指標を算出し、目的としない第2のクラスのそれぞれに対応付けられた非負の各第3の教師データを、周波数領域又は時間領域においてそれぞれ分割し、分割された領域ごとの前記各第3の教師データの観測行列に基づいて、前記分割された領域ごとの前記第2のクラス間の分離度を示す第2の評価指標を算出し、前記第1の評価指標が予め設定された第1の閾値よりも高い、前記分割された領域を抽出することにより、第1の領域を特定し、前記第2の評価指標が予め設定された第2の閾値よりも高い、前記分割された領域を抽出することにより、第2の領域を特定し、特定した前記第1及び第2の領域に基づいて、前記所定のデータ領域を特定することを実施する、プログラムが提供される。 In order to solve the above-mentioned problems, according to still another aspect of the present invention, there is provided a program for classifying time series data into a desired first class, the program including at least a frequency domain or a time domain. A function of acquiring non-negative evaluation data of a predetermined data area from the time-series data expressed in (3) and non-negative matrix factorization of the non-negative first teacher data corresponding to the predetermined data area A teacher coefficient matrix generated by the above, and a function of storing a classification model parameter generated based on the first class associated with the first teacher data; Based on the teacher basis matrix generated by performing non-negative matrix factorization, the function of generating an evaluation coefficient matrix from the evaluation data, the calculated evaluation coefficient matrix, based on the classification model parameters, In the function of realizing the function of classifying into the first class and the function of specifying the predetermined data area and specifying the predetermined data area, a non-negative value associated with each of the first classes is provided. Of the second teacher data of each of the divided regions in the frequency domain or the time domain, and based on the observation matrix of the second teacher data of each of the divided regions, A first evaluation index indicating the degree of separation between classes is calculated, and each non-negative third teacher data associated with each of the second classes not intended is divided in the frequency domain or the time domain, A second evaluation index indicating the degree of separation between the second classes for each divided region is calculated based on the observation matrix of each of the third teacher data for each divided region, and the first evaluation index is calculated. The first threshold is specified by extracting the divided area in which the evaluation index of is higher than the first threshold set in advance, and the second threshold in which the second evaluation index is set in advance. A second area is identified by extracting the divided area that is higher than the first area, and the predetermined data area is identified based on the identified first and second areas. The program is provided.
以上説明したように本発明によれば、処理量の増加をより抑制しつつ、分類の精度をより向上させることができる。 As described above, according to the present invention, it is possible to further suppress the increase in the processing amount and further improve the classification accuracy.
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。また、本明細書及び図面において、類似する構成要素については、同一の符号の後に異なるアルファベットを付して区別する場合がある。ただし、類似する構成要素の各々を特に区別する必要がない場合、同一符号のみを付する。 Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. In this specification and the drawings, constituent elements having substantially the same functional configuration are designated by the same reference numerals, and a duplicate description will be omitted. In this specification and the drawings, similar components may be distinguished by attaching different alphabets after the same reference numerals. However, if there is no particular need to distinguish between similar components, only the same reference numerals will be given.
<<背景>>
まず、本発明に係る実施形態を説明する前に、本発明者が本発明に係る実施形態を創作するに至る背景について説明する。
<<Background>>
First, before describing the embodiments of the present invention, the background leading to the creation of the embodiments of the present invention by the present inventor will be described.
先に説明したように、従来、センシングにより得られた信号等の連続的に発生する時系列データの一例である音響信号等のデータを解析、分類するために、非負値行列因子分解を用いる技術が研究されている。 As described above, a technique using non-negative matrix factorization to analyze and classify data such as acoustic signals, which is one example of continuously generated time series data such as signals obtained by sensing, as described above. Is being studied.
上述のような技術は、時系列データを解析、分類する際に有効な手段である。しかしながら、近年、解析、分類するデータとしては、好適なデータとは言えない現実に存在する様々な時系列データであっても、分類する精度をより高めることが強く求められるようになってきている。また、上述のような現実に存在する様々な時系列データは、様々なパラメータが複雑に組み合わされたデータであることが多いことから、このような時系列データを処理する際に、処理時間が増加し、且つ、処理装置の負担が増加する傾向が顕著に表れるようになってきていた。 The technique as described above is an effective means for analyzing and classifying time series data. However, in recent years, as data to be analyzed and classified, even for various kinds of actually existing time series data that are not suitable data, there is a strong demand for higher accuracy of classification. .. Moreover, since various time-series data that actually exist as described above are often data in which various parameters are combined in a complicated manner, the processing time when processing such time-series data is The tendency that the number of processing devices increases and the load on the processing device also increases has become remarkable.
そこで、本発明者は、上述の状況を鑑みて、処理量の増加をより抑制しつつ、分類の精度をより向上させることが可能な、本発明の実施形態を創作するに至った。以下、このような本発明の実施形態を順次詳細に説明する。 Therefore, in view of the above situation, the present inventor has created an embodiment of the present invention capable of further improving the classification accuracy while further suppressing an increase in the processing amount. Hereinafter, such embodiments of the present invention will be sequentially described in detail.
<<実施形態>>
以下に説明する実施形態においては、センサから取得される時系列データは、例えば、測定対象物(例えばコンクリート等)に対してハンマー等の打具で打撃した際の打音を収音して得られた音響信号であってもよい。さらに、以下の説明においては、一例として、情報処理装置が、当該音響信号に基づいて当該測定対象物が正常であるか異常であるかを示す2つのクラス(目的とする第1のクラス)に自動的に分類する機能を有する例について説明するが、本発明は係る例に限定されるものではない。
<<Embodiment>>
In the embodiment described below, the time-series data acquired from the sensor is obtained by, for example, collecting a tapping sound when hitting an object to be measured (such as concrete) with a hitting tool such as a hammer. It may be an acoustic signal that has been recorded. Furthermore, in the following description, as an example, the information processing device is divided into two classes (first target class) indicating whether the measurement object is normal or abnormal based on the acoustic signal. Although an example having a function of automatically classifying will be described, the present invention is not limited to such an example.
また、以下の説明においては、センサからの時系列データに対する、フーリエ変換によって得られたパワースペクトル、短時間フーリエ変換によって得られたスペクトログラムや、ウェーブレット変換によって得られたスカトログラム等、時間、周波数、振幅の関係を表したデータを総称して、時間・周波数・振幅データと呼ぶ。すなわち、当該時間・周波数・振幅データは、少なくとも周波数領域又は時間領域において表現されたデータであると言え、例えば、周波数領域、及び時間領域における振幅の値を示すデータとして表現されることができる。 Further, in the following description, for time series data from the sensor, a power spectrum obtained by Fourier transform, a spectrogram obtained by short-time Fourier transform, a scatogram obtained by wavelet transform, etc., time, frequency, Data representing the relationship between amplitudes is generically called time/frequency/amplitude data. That is, it can be said that the time/frequency/amplitude data is data expressed at least in the frequency domain or the time domain, and can be expressed as, for example, data indicating amplitude values in the frequency domain and the time domain.
また、以下の説明においては、分類の対象となるデータを評価データと呼び、評価データを分類する前に、事前に正確ラベル(クラス)と対応させて分類に必要なモデルを作るためのデータを教師データと呼ぶ。そして、上記正解ラベルは、教師データを変換して得られた教師観測行列(非負の教師データ)に含まれる各観測ベクトルが属するクラスを示すラベルのことをいう。加えて、以下の説明においては、教師データを変換して得られた教師観測行列を非負値行列因子分解分解して得られる基底行列及び係数行列を、それぞれ教師基底行列、教師係数行列と呼ぶ。さらに、以下の説明においては、評価データを変換して得られた評価観測行列(非負の評価データ)を非負値行列因子分解分解して得られる基底行列及び係数行列を、それぞれ評価基底行列、評価係数行列と呼ぶ。 Also, in the following explanation, the data to be classified is called evaluation data, and before classifying the evaluation data, the data for making a model necessary for classification by associating with the accurate label (class) in advance is classified. Called teacher data. The correct label is a label indicating the class to which each observation vector included in the teacher observation matrix (non-negative teacher data) obtained by converting the teacher data belongs. In addition, in the following description, the basis matrix and the coefficient matrix obtained by performing non-negative matrix factorization of the teacher observation matrix obtained by converting the teacher data are referred to as a teacher basis matrix and a teacher coefficient matrix, respectively. Furthermore, in the following description, the basis matrix and coefficient matrix obtained by performing non-negative value matrix factorization of the evaluation observation matrix (non-negative evaluation data) obtained by converting the evaluation data are the evaluation basis matrix and the evaluation matrix, respectively. Called the coefficient matrix.
<情報処理システム10の概略構成>
まずは、図1を参照して、本発明の実施形態に係る情報処理システム(分類システム)10の概略構成を説明する。図1は、本実施形態に係る情報処理システム10の概略的な構成の一例を示す説明図である。
<Schematic configuration of
First, a schematic configuration of an information processing system (classification system) 10 according to the embodiment of the present invention will be described with reference to FIG. FIG. 1 is an explanatory diagram showing an example of a schematic configuration of an
本実施形態に係る情報処理システム10は、例えば、測定対象物に対する打音の時系列データ(音響データ)を取得し、取得した時系列データに基づき、当該測定対象物が正常であるか異常であるかをクラス分け、すなわち分類を行う分類システムである。図1に示すように、本実施形態に係る情報処理システム10は、上記時系列データを取得するためのセンサ100と、分類を行う情報処理装置(分類装置)200とを主に含む。以下に、情報処理システム10に含まれる各装置の概要について説明する。
The
(センサ100)
センサ100は、観測対象の状態の変化を物理的な変化として検出し、検出した時系列データを情報処理装置200に出力する。例えば、センサ100は、周辺の音を音響信号として取得するマイクロフォン等の音響センサであってもよく、加速度データを取得する加速度センサや、温度データを取得する温度センサ等であってもよく、時系列データを取得できるものであれば特に限定されるものではない。
(Sensor 100)
The
(情報処理装置200)
情報処理装置200は、センサ100から出力された時系列データを解析して分類する装置である。詳細には、情報処理装置200は、センサ100により得られる信号等の連続的に発生する時系列データ(教師データ)を用いて、複数のクラスに分類するための分類モデルパラメータを生成するパラメータ生成装置としての機能と、時系列データ(評価データ)を複数のクラスに分類する分類装置としての機能とを有する。例えば、図1に示すように、情報処理装置200は、クラウド200a、IoTゲートウェイ200b、エッジ端末200c等であることができる。これら情報処理装置200の詳細構成については後述する。なお、本実施形態に係る情報処理システム10は、クラウド200a、IoTゲートウェイ200b、エッジ端末200c等のような情報処理装置200を少なくとも1つ含んでいればよい。
(Information processing device 200)
The
<情報処理装置200の詳細構成>
以上、本発明の実施形態に係る情報処理システム10の概略構成を説明した。次に、図2を参照して、本発明の実施形態に係る情報処理装置200の一例の詳細構成を説明する。図2は、本発明の実施形態に係る情報処理装置200の構成例を説明するためのブロック図である。図2に示すように、本実施形態に係る情報処理装置200は、データ取得部202、操作部204、処理部210、教師データ処理部220、パラメータ生成部222、記憶部224、特徴抽出部226、分類部228、及び出力部230を主に有する。以下に情報処理装置200の有する各機能部について説明する。
<Detailed Configuration of
The schematic configuration of the
(データ取得部202)
データ取得部202は、センサ100から、少なくとも周波数領域又は時間領域において表現された時系列データを取得し、後述する処理部210に取得した時系列データを出力する。
(Data acquisition unit 202)
The
(操作部204)
操作部204は、ユーザの入力を受け付け、入力情報を処理部210に出力する。例えば、ユーザは、操作部204を操作して、教師データを取得するか、又は、評価データを取得するかを示す情報を入力してもよい。さらに、ユーザは、操作部204を操作して、データ取得部202により現在取得されている時系列データに対応するクラス(正解ラベル)を示す情報を入力してもよい。なお、操作部204は、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、レバー、又はダイヤル等により実現されてもよい。
(Operation unit 204)
The
(処理部210)
処理部210は、データ取得部202により取得された時系列データに基づいて、分類モデルパラメータ生成処理のための教師データ、及び、分類処理のための評価データを取得する。詳細には、図2に示すように、本実施形態に係る処理部210は、変換部212、対応付け部214、データ分割部216、及び、分離度評価部(領域特定部)218としての機能を有する。以下に、処理部210の各機能について説明する。
(Processing unit 210)
The
〜変換部212〜
変換部212は、データ取得部202からの時系列データ(教師データ及び評価データ)に対して、フーリエ変換、短時間フーリエ変換、又は、ウェーブレット変換を行い、時間・周波数・振幅データ(詳細には、非負の観測ベクトル(例えば、周波数領域表現に変換されたデータ)を含む非負の観測行列)を生成する。例えば、先に説明したように、時間・周波数・振幅データは、パワースペクトル、スペクトログラム、又は、スカログラムであってもよい。また、変換部212は、後述する分離度評価部218によって特定された領域(対象領域)の時系列データに対して、フーリエ変換等を行い、時間・周波数・振幅データを生成してもよい。本実施形態においては、パワースペクトル、スペクトログラム、スカログラム等のような周波数領域等で表現されるデータを用いることにより、後述の教師データ処理部220、又は特徴抽出部226等の処理において、分類したいクラスの特徴をより高精度に抽出することができる。
-Conversion unit 212-
The
〜対応付け部214〜
対応付け部214は、データ取得部202からの時系列データ(教師データ)と、操作部204を介してユーザにより入力される正解ラベル(クラス)とを、対応付ける。そして、当該正解ラベルに紐づけられた時系列データは、上述の変換部212によって変換され、後述する教師データ処理部220に出力される。
~
The associating
〜データ分割部216〜
データ分割部216は、変換部212での変換により生成した教師データ又は評価データに係る時間・周波数・振幅データを、周波数領域、又は時間領域において分割する。なお、データ分割部216は、予めユーザによって決められた分割のルール(いくつに分割するか、どの程度の大きさの領域に分割するか等)に従って分割することができ、ユーザは分割ルールを好適に変更することにより、分類したいクラスの特徴をより高精度に抽出したり、より高精度に分類したりすることが可能となる。
-Data division unit 216-
The
〜分離度評価部218〜
分離度評価部218は、データ分割部216により分割された各領域でのクラスの分類能力を示す分離度を評価する。分離度を示す指標としては、例えば、クラス内・クラス間分散比、マハラノビス距離、又は、クラスの分類正解率等を用いることができる。詳細には、分離度評価部218は、データ分割部216により分割された領域ごとに、目的とするクラス(第1のクラス)の分離度(第1の評価指標)を評価して、分離度の高い領域(第1の領域)を抽出し、目的外のクラス(第2のクラス)の分離度(第2の評価指標)を評価して、分離度の高い領域(第2の領域)を抽出し、抽出したこれら領域に基づいて、教師データ及び評価データを取得する対象領域(所定の領域)を特定する。より具体的には、分離度評価部218は、例えば、目的のクラスの分離度の高い領域から、目的外のクラスの分離度の高い領域を除去することにより、教師データ及び評価データを取得する対象領域を特定する。すなわち、本実施形態においては、教師データの全体を用いて分類パラメータを生成し、且つ、評価データの全体を用いて分類を行うのではない。本実施形態においては、目的のクラス分離度が高く、且つ、目的外のクラス分離度が高くない対象領域の教師データ用いて分類パラメータを生成し、さらに、当該対象領域の評価データを用いて分類を行うことにより、目的外のクラスの特徴に邪魔されることなく、分類したい目的のクラスの特徴をより高精度に抽出したり、目的のクラスにより高精度に分類したりすることができる。
~ Separation
The degree-of-
さらに、分離度評価部218によって特定された対象領域の教師データ及び評価データの時間・周波数・振幅データは、後述する教師データ処理部220及び特徴抽出部226にそれぞれ出力される。
Furthermore, the teacher data of the target area and the time/frequency/amplitude data of the evaluation data specified by the separation
なお、処理部210は、上述の処理に加えて、変換部212による変換前の時系列データからオフセット値を引く処理、変換後の時間・周波数・振幅データに対する周波数フィルタリング処理等の処理を必要に応じて行ってもよい。また、処理部210の動作の詳細については、後述する。
In addition to the above-described processing, the
(教師データ処理部220)
教師データ処理部220は、処理部210から受け取った分離度評価部218によって特定された対象領域の時間・周波数・振幅データ(非負の第1の教師データ)(詳細には、教師観測行列)に対して、非負値行列因子分解を行うことにより、教師基底行列及び教師係数行列を生成する(詳細については後述する)。そして、教師データ処理部220は、生成した教師基底行列を正解ラベル(クラス)と対応付けて、後述するパラメータ生成部222及び記憶部224に出力する。なお、教師データ処理部220の動作の詳細については後述する。
(Teacher data processing unit 220)
The teacher
(パラメータ生成部222)
パラメータ生成部222は、上述の教師係数行列及び正解ラベルに基づいて、時系列データを目的のクラスに分類するための分類モデルパラメータを生成する。パラメータ生成部222が生成する分類モデルパラメータは、後述する分類部228における分類モデルに応じたパラメータであってもよい。例えば、分類部228が閾値判別を行う場合の分類モデルパラメータは閾値であってもよい。また、分類部228が線形判別を行う場合の分類モデルパラメータはクラスの境界を決定する線形判別関数の係数であってもよく、分類部228が二次判別を行う場合の分類モデルパラメータはクラスの境界を決定する二次判別関数の係数であってもよい。パラメータ生成部222は、上記のようにして生成した分類モデルパラメータを、記憶部224に出力し、格納させる。
(Parameter generation unit 222)
The
(記憶部224)
記憶部224は、情報処理装置200の各機能部が機能するためのプログラムやパラメータを格納する。例えば、記憶部224は、教師データ処理部220が対象領域の時間・周波数・振幅データ(非負の第1の教師データ)に対して非負値行列因子分解を行うことで生成された教師基底行列と、パラメータ生成部222により生成された分類モデルパラメータとを格納する。
(Storage unit 224)
The
(特徴抽出部226)
特徴抽出部226は、記憶部224に格納された教師基底行列に基づいて、処理部210により出力された対象領域の時間・周波数・振幅データ(非負の評価データ)から評価係数行列を生成し、生成した評価係数行列を後述する分類部228に出力する。なお、特徴抽出部226の動作の詳細については後述する。
(Feature extraction unit 226)
The
(分類部228)
分類部228は、上記評価係数行列を、記憶部224に格納された分類モデルパラメータに基づいて、目的とするクラスに分類する。分類部228は、例えば、評価係数行列に含まれる係数ベクトルを特徴ベクトルとし、様々な分類モデルを用いて、当該分類モデルに応じた分類モデルパラメータに基づいた分類を行うことが可能である。具体的には、分類部228は、例えば、閾値判別、線形判別、二次判別、又はSVM(Support Vector Machine)等に基づく分類モデルを用いて、分類することができる。
(Classification unit 228)
The
(出力部230)
出力部230は、分類部228による分類結果を出力する。出力部230は、例えば分類結果を表示するディスプレイ等の表示装置、又は分類結果を音声出力するスピーカ等であることができる。
(Output unit 230)
The
<概要>
以上、本発明の実施形態に係る情報処理装置200の詳細構成を説明した。続いて、本実施形態に係る動作例を説明する前に、図3及び図4を参照して、本実施形態の概要について説明する。図3は、本実施形態に係るNMFの処理例を模式的に示す説明図であり、図4は、次元の削減を説明するための模式図である。
<Overview>
The detailed configuration of the
(非負値行列因子分解)
本実施形態においては、上述した変換部212の変換によって、非負の観測ベクトル(周波数領域表現に変換されたデータ)を含む非負の観測行列を得ることができる。当該観測行列は、1の対象区間から得られる観測ベクトルを、1又は複数並べた行列である。また、以下の説明では、先に説明したように、教師データとして取得される観測行列を教師観測行列と呼び、評価データとして取得される観測行列を評価観測行列と呼んで区別する場合がある。
(Nonnegative matrix factorization)
In the present embodiment, a non-negative observation matrix including a non-negative observation vector (data converted into a frequency domain representation) can be obtained by the conversion of the
ところで、非負値行列因子分解(Non−negative Matrix Factorization、以下、NMFと呼ぶ)は、1の非負行列Yを2つの非負行列W、Hの積(例えばWH)に分解するアルゴリズムである。1の非負行列Yを2つの非負行列W、Hに分解することにより、元の非負行列Yの持つ潜在的要素(特徴)を明確にすることができる。そして、2つの非負行列W、Hを解析的に求めることは困難であるため、初期値を与えてYとWHの誤差が局所最適解になるよう、反復的に近似解を求める手法が提案されている(例えば、上記非特許文献1、2等)。なお、一般に、局所最適解は初期値に依存して変化する。 Non-negative matrix factorization (hereinafter referred to as NMF) is an algorithm that decomposes one non-negative matrix Y into two non-negative matrices W and H (for example, WH). By decomposing the one non-negative matrix Y into two non-negative matrices W and H, the latent element (feature) of the original non-negative matrix Y can be clarified. Since it is difficult to analytically determine the two non-negative matrices W and H, a method for iteratively obtaining an approximate solution so that an error between Y and WH is a local optimum solution by providing an initial value is proposed. (For example, Non-Patent Documents 1 and 2 above). Note that the local optimum solution generally changes depending on the initial value.
図3に示すように、NMFにより、例えば、非負の観測行列Y(教師観測行列、又は評価観測行列)は、非負の係数行列W、及び非負の基底行列Hの積に分解される。 As shown in FIG. 3, for example, a non-negative observation matrix Y (teacher observation matrix or evaluation observation matrix) is decomposed into a product of a non-negative coefficient matrix W and a non-negative basis matrix H by NMF.
さらに、図3に示すように、本実施形態に係る観測行列Yは、例えば、m次元の観測ベクトルyが行ベクトルとなって、時系列データにおける対象区間の数nだけの行で構成されたn行m列の行列である。 Further, as shown in FIG. 3, the observation matrix Y according to the present embodiment is composed of, for example, the m-dimensional observation vector y as a row vector, and the rows are the number n of the target sections in the time-series data. It is a matrix with n rows and m columns.
本実施形態に係る基底行列Hは、例えば、観測行列YにNMFを適用し、分解されたm次元の基底ベクトルhが行ベクトルとなって、基底ベクトルの数kだけの行で構成されたk行m列の行列である。 The basis matrix H according to the present embodiment is obtained by applying NMF to the observation matrix Y, and the decomposed m-dimensional basis vector h is a row vector, and k is composed of as many rows as the number k of basis vectors. It is a matrix with rows and m columns.
本実施形態に係る係数行列Wは、例えば、k次元の係数ベクトルwが行ベクトルとなって、観測ベクトルの数nだけの行で構成されたn行k列の行列である。ここで係数ベクトルwは、ある観測ベクトルにおいて、基底行列Hに含まれる各基底ベクトルの成分がどれだけ含まれるか、という加重値を示す行ベクトルである。 The coefficient matrix W according to the present embodiment is, for example, a matrix of n rows and k columns that is configured by k rows of k-dimensional coefficient vectors w and has rows of the number n of observation vectors. Here, the coefficient vector w is a row vector indicating a weighted value indicating how many components of each basis vector included in the basis matrix H are included in a certain observation vector.
図3に示すように、上記の行列においては、以下の数式(1)の関係がある。 As shown in FIG. 3, in the above matrix, there is a relationship of the following mathematical expression (1).
なお、先に説明したように、教師観測行列YLを分解して得られる基底行列、及び係数行列は、それぞれ教師基底行列HL、教師係数行列WLとなる。 As described above, the basis matrix and the coefficient matrix obtained by decomposing the teacher observation matrix Y L are the teacher basis matrix H L and the teacher coefficient matrix W L , respectively.
本実施形態においては、上述した教師データ処理部220により、教師観測行列YLに対応付けられた正解ラベルのクラスごとにNMFを適用して、教師基底行列HL、教師係数行列WLを得ることができる。
In the present embodiment, the teacher
例えば、教師データ処理部220は、まず教師観測行列YLの各クラス(c1,c2,・・・,cN)のデータセット(観測ベクトル又は観測行列)YC1,YC2,・・・,YCNごとにNMFを適用する。教師データ処理部220は、データセットYC1,YC2,・・・,YCNのそれぞれが分解されて得られたベクトルまたは行列HC1,HC2,・・・,HCNにより、教師基底行列HL={HC1,HC2,・・・,HCN}を生成する。
For example, the teacher
そして、教師基底行列HLに基づいて、教師観測行列YLから生成される係数行列を教師係数行列WLとすると、数式(1)より、教師観測行列YL、教師係数行列WL、及び教師基底行列HLの関係は、以下の数式(2)で表わすことができる。 Then, assuming that the coefficient matrix generated from the teacher observation matrix Y L based on the teacher basis matrix H L is the teacher coefficient matrix W L , the teacher observation matrix Y L , the teacher coefficient matrix W L , and The relationship of the teacher basis matrix H L can be expressed by the following mathematical expression (2).
上記数式(2)より、教師係数行列WLを得るためには、教師基底行列HLの逆行列を用いる必要がある。しかし、教師基底行列HLは、一般に正則行列とは限らないため、逆行列を持たない場合がある。そこで、教師データ処理部220は、例えば教師基底行列の疑似逆行列(ムーア‐ペンローズの疑似逆行列)に基づいて、教師係数行列WLを生成してもよい。教師基底行列HLの疑似逆行列HL +は、k×mの行列であり、一般にk<mであるため、擬似逆行列HL +は、以下の数式(3)で表すことができる。
From Equation (2) above, in order to obtain the teacher coefficient matrix W L , it is necessary to use the inverse matrix of the teacher base matrix H L. However, since the teacher basis matrix H L is not generally a regular matrix, it may not have an inverse matrix. Therefore, the teacher
上記数式(3)で得られた疑似逆行列HL +を用いて、教師係数行列WLは以下の数式(4)で表すことができる。 The teacher coefficient matrix W L can be expressed by the following mathematical expression (4) using the pseudo inverse matrix H L + obtained by the mathematical expression (3).
NMFは、一般に振幅が大きく、頻出する度合が大きいデータに対応する特徴を持つ規定が生成されやすい。従って、全てのデータセットに対して一括でNMFを適用する際、クラスによって振幅の小さいデータや出現回数の低いデータがあると、そのクラスのデータに対応した特徴を持つ基底が生成され難い場合がある。そこで、本実施形態においては、クラスごとにNMFを適用することにより、振幅の小さいデータや、出現回数の低いデータに対応した特徴を持つ基底も生成されやすくなり、分類精度をより向上させることができる。なお、本実施形態においては、複数のクラス、又は全てのクラスのデータセットに対して一括でNMFが適用されてもよい。 NMF generally has a large amplitude, and it is easy to generate a rule having a characteristic corresponding to data that frequently occurs. Therefore, when NMF is applied to all data sets at once, if there is data with small amplitude or data with low number of appearances depending on the class, it may be difficult to generate a base having features corresponding to the data of the class. is there. Therefore, in the present embodiment, by applying the NMF for each class, a base having a feature corresponding to the data with a small amplitude or the data with a low appearance frequency is easily generated, and the classification accuracy can be further improved. it can. In this embodiment, NMF may be collectively applied to a plurality of classes or data sets of all classes.
なお、上述した教師データ処理部220は、生成した教師基底行列HLを、上記対応付け部214により対応付けられた正解ラベル(クラス)と紐づけて、上記パラメータ生成部222及び記憶部224に出力する。
The teacher
次に、本実施形態においては、上述した特徴抽出部226は、記憶部224に格納された教師基底行列HLに基づいて、評価データの評価観測行列YTから評価係数行列WTを生成する。なお、先に説明したように、評価観測行列YTを分解して得られる基底行列、及び係数行列は、それぞれ評価基底行列HT、教師係数行列WTとなる。以下、特徴抽出部226による評価係数行列WTの生成例について説明する。
Next, in the present embodiment, the above-described
上記数式(1)に基づいて、教師基底行列HL、評価観測行列YT及び評価係数行列WTの関係は、以下の数式(5)によって示すことができる。 The relationship between the teacher basis matrix H L , the evaluation observation matrix Y T, and the evaluation coefficient matrix W T can be expressed by the following Expression (5) based on the above Expression (1).
上記数式(3)と同様の方法で得られた疑似逆行列HL +を用いて、評価係数行列WTは、以下の数式(6)で示すことができる。 The evaluation coefficient matrix W T can be expressed by the following formula (6) by using the pseudo inverse matrix H L + obtained by the same method as the formula (3).
そして、本実施形態においては、特徴抽出部226は、上述のようにして生成した評価係数行列WTを分類部228に出力し、分類部228は、評価係数行列WTを、記憶部224に格納された分類モデルパラメータに基づいて分類する。
Then, in the present embodiment, the
本実施形態においては、以上のように、基底行列に対する重みを示す係数ベクトルを特徴ベクトルとして用いて分類することで、例えば特定周波数のパワーの大きさに基づいて直接的に分類するよりも、分類精度を向上させることができる。 In the present embodiment, as described above, the classification is performed by using the coefficient vector indicating the weight with respect to the basis matrix as the feature vector, rather than the direct classification based on the magnitude of the power of the specific frequency, for example. The accuracy can be improved.
また、本実施形態においては、評価データ(時系列データ)自体を用いて分類処理を行った場合に比べ、評価データから生成される評価係数行列WTを用いて分類処理を行うことにより、分類処理における特徴ベクトルの次元が削減され、分類処理の処理量を抑制することができる。 Further, in the present embodiment, the classification process is performed by using the evaluation coefficient matrix W T generated from the evaluation data, as compared with the case where the classification process is performed using the evaluation data (time series data) itself. The dimension of the feature vector in the processing is reduced, and the processing amount of the classification processing can be suppressed.
例えば、図4に示すように、NMFにより、パワースペクトルである評価データG20は、基底ベクトルG21及び係数W1の積と、基底ベクトルG22及び係数W2の積と、の和で表わすことができる。図4の例において、評価データG20を特徴ベクトルとして分類処理を行う場合には、評価データG20における周波数分解能に応じた次元での処理が必要となる。一方、図4の例において、係数ベクトルの次元は2である。従って、上述したように、評価データG20の次元よりも係数ベクトルの次元数の方が小さいため、評価係数行列WTを用いて分類処理を行うことで、分類処理における特徴ベクトルの次元が削減され、分類処理の処理量を抑制することができる。 For example, as shown in FIG. 4, by NMF, the evaluation data G20 which is a power spectrum can be represented by the sum of the product of the basis vector G21 and the coefficient W 1 and the product of the basis vector G22 and the coefficient W 2. .. In the example of FIG. 4, when performing the classification process using the evaluation data G20 as a feature vector, it is necessary to perform processing in a dimension according to the frequency resolution of the evaluation data G20. On the other hand, in the example of FIG. 4, the dimension of the coefficient vector is 2. Therefore, as described above, since the dimension number of the coefficient vector is smaller than the dimension of the evaluation data G20, the dimension of the feature vector in the classification processing is reduced by performing the classification processing using the evaluation coefficient matrix W T. The processing amount of the classification processing can be suppressed.
(対象領域)
しかしながら、NMFを用いることにより、分類処理の処理量を抑制できるものの、スペクトログラムやスカログラムは、時間と周波数の2軸を有するデータであることから、スペクトログラム等に対してNMFを適用した場合、処理量の抑制に限界がある場合がある。
(Target area)
However, although the amount of classification processing can be suppressed by using NMF, since the spectrogram and scalogram are data having two axes of time and frequency, when NMF is applied to a spectrogram, etc. There may be a limit to the suppression of.
また、NMFは、先に説明したように、一般に、振幅の値や、出現頻度が高い基底が選ばれやすい。従って、時間・周波数・振幅データの全体に対してNMFを適用すると、データによっては、例えば、クラスの分離能力が低く振幅の大きな基底が選ばれ、クラスの分離能力が高く振幅の小さな基底が選ばれてしまうことがある。このような場合、分離精度が低下する場合も存在することから、分類の精度の向上には限界があることがあった。 In addition, as described above, in general, the NMF is likely to select a value of amplitude or a base with a high appearance frequency. Therefore, when NMF is applied to the entire time/frequency/amplitude data, for example, a base with a low class separation ability and a large amplitude is selected, and a base with a high class separation capacity and a small amplitude is selected depending on the data. It may be lost. In such a case, since the separation accuracy may decrease, there is a limit in improving the classification accuracy.
分類の精度の限界が存在する場合があることを、図5を参照して説明する。図5は、時間・周波数・振幅データの全体に対してNMFを適用した例を示す模式図である。なお、図5に示すスペクトログラムG61、G62は、それぞれクラス1、クラス2の特徴を示すスペクトログラムである。さらに、スペクトログラムG61、G62においては、黒色の濃さが振幅の大きさを示している。 It will be described with reference to FIG. 5 that there may be a limit of classification accuracy. FIG. 5 is a schematic diagram showing an example in which NMF is applied to the entire time/frequency/amplitude data. The spectrograms G61 and G62 shown in FIG. 5 are spectrograms showing the characteristics of class 1 and class 2, respectively. Furthermore, in the spectrograms G61 and G62, the darkness of black indicates the magnitude of the amplitude.
図5に示す例においては、振幅の大きい領域R1における振幅の大きさは、クラス1の特徴を示すスペクトログラムG61、及びクラス2の特徴を示すスペクトログラムG62に共通して現れ、分類に有効な特徴ではないものとする。一方、図15に示す例においては、振幅の小さい領域R2、及び領域R3における振幅の大きさは、クラス1、及びクラス2の分類に有効な特徴であるものとする。 In the example shown in FIG. 5, the magnitude of the amplitude in the region R1 where the amplitude is large appears commonly in the spectrogram G61 showing the features of class 1 and the spectrogram G62 showing the features of class 2, and is not a feature effective for classification. Make it not exist. On the other hand, in the example shown in FIG. 15, it is assumed that the magnitudes of the amplitudes in the regions R2 and R3 where the amplitude is small are effective characteristics for class 1 and class 2.
しかしながら、スペクトログラムG61、G62のデータ全体に対してNMFを適用してしまうと、振幅の大きい領域R1に対応する基底G611、G621が選択され、クラス1とクラス2の分類に有効な特徴を示す振幅の小さな基底は選択されない場合がある。このような場合、スペクトログラムG61から得られる係数G613、及びスペクトログラムG62から得られる係数G623が同一となり、クラス1とクラス2とを精度よく分類することが難しくなる。 However, if NMF is applied to the entire data of the spectrograms G61 and G62, the bases G611 and G621 corresponding to the region R1 having a large amplitude are selected, and the amplitudes that are effective for the classification of class 1 and class 2 are selected. Small bases of may not be selected. In such a case, the coefficient G613 obtained from the spectrogram G61 and the coefficient G623 obtained from the spectrogram G62 are the same, which makes it difficult to accurately classify the class 1 and the class 2.
そこで、本実施形態においては、分類の精度をより向上させるために、クラス分類に有効な時間領域と周波数領域に限定して部分的にNMFを適用する。このような適用例について、図6を参照して説明する。図6は、時間・周波数・振幅データの部分に対してNMFを適用した例を示す模式図である。 Therefore, in the present embodiment, in order to further improve the accuracy of classification, NMF is partially applied only in the time domain and frequency domain effective for class classification. Such an application example will be described with reference to FIG. FIG. 6 is a schematic diagram showing an example in which NMF is applied to the time/frequency/amplitude data portion.
図6に示すスペクトログラムG71、G72は、図5に示したスペクトログラムG61、G62と同様に、それぞれクラス1、クラス2の特徴を示すスペクトログラムである。図6に示すように、スペクトログラムG71、G72の領域R4に限定して部分的にNMFを適用すると、領域R2に対応する基底G711、G721と、領域R3に対応する基底G712、G722が選択される。その結果、スペクトログラムG71から得られる係数G713、及び係数G714と、スペクトログラムG72から得られる係数G723、及び係数724とが大きく異なり、容易にクラス1とクラス2を分類することができる。すなわち、クラス分類に有効な時間領域と周波数領域に限定して部分的にNMFを適用することにより、分類の精度をより向上させることができる。また、本実施形態においては、領域R4に限定してNMFを適用すればよいため、処理量の抑制をさらに進めることもできる。 The spectrograms G71 and G72 shown in FIG. 6 are spectrograms showing the characteristics of class 1 and class 2, respectively, similarly to the spectrograms G61 and G62 shown in FIG. As shown in FIG. 6, when the NMF is partially applied only to the region R4 of the spectrograms G71 and G72, the bases G711 and G721 corresponding to the region R2 and the bases G712 and G722 corresponding to the region R3 are selected. .. As a result, the coefficient G713 and the coefficient G714 obtained from the spectrogram G71 are greatly different from the coefficient G723 and the coefficient 724 obtained from the spectrogram G72, and the class 1 and the class 2 can be easily classified. That is, the accuracy of classification can be further improved by partially applying NMF only to the time domain and frequency domain effective for class classification. Further, in the present embodiment, since NMF may be applied only to the region R4, it is possible to further reduce the processing amount.
例えば、一般に打音データは限られた時間帯のデータであり、時間・周波数・振幅データにおいて所定の振幅が現れる一部の時間帯や周波数帯に限定して目的に応じた分析を行えば十分である場合がある。また、特定の周波数帯の音を出力する機械の振動音等のデータであっても、その周波数帯に限定して目的に応じた分析を行えば十分であることがある。 For example, tapping data is generally data in a limited time zone, and it is sufficient to perform analysis according to the purpose by limiting it to a part of the time zone or frequency zone where a predetermined amplitude appears in the time/frequency/amplitude data. May be. Further, even for data such as vibration noise of a machine that outputs a sound in a specific frequency band, it may be sufficient to perform analysis according to the purpose by limiting the frequency band.
さらに、本実施形態においては、分類の精度をより向上させるために、目的とするクラス分類に有効な時間領域と周波数領域に限定するだけでなく、目的外のクラス分類に有効な時間領域と周波数領域を除外した上で部分的にNMFを適用する。すなわち、本実施形態においては、目的のクラス分離度が高く、且つ、目的外のクラス分離度が高くない領域に限定してNMFを適用することにより、目的外のクラスの特徴に邪魔されることなく、分類したい目的のクラスの特徴をより高精度に抽出したり、目的のクラスに、より高精度に分類したりすることができる。その結果、本実施形態においては、分類の精度をより向上させることができる。加えて、本実施形態においては、領域を限定してNMFを適用すればよいため、処理量の抑制をさらに進めることもできる。 Further, in the present embodiment, in order to further improve the accuracy of classification, not only the time domain and frequency domain effective for the target class classification but also the time domain and frequency effective for the non-target class classification are used. The NMF is partially applied after excluding the region. That is, in the present embodiment, by applying the NMF only to the region where the target class separation is high and the non-target class separation is not high, the characteristics of the non-target class are disturbed. The feature of the desired class to be classified can be extracted with higher accuracy, or can be classified into the target class with higher accuracy. As a result, in this embodiment, the accuracy of classification can be further improved. In addition, in the present embodiment, since it is sufficient to limit the area and apply the NMF, it is possible to further suppress the processing amount.
なお、以下の説明においては、目的とするクラス分類とは、例えば、測定対象物が正常であるか異常であるかを示す2つのクラス(測定対象物(機械)の状態に関するクラス)に分類することである。また、目的外のクラス分類としては、例えば、測定対象物(機械)の個体差に関するクラス、又は、測定対象物(機械)が設置された環境差に関するクラスについて分類することである。すなわち、本実施形態においては、上述のように部分的にNMFを適用することにより、例えば、測定対象物の個体差や環境差異による影響をより抑えて、目的とする当該測定対象物が正常であるか異常であるかを示すクラスの特徴を高精度に抽出することができる。 In the following description, the target class classification is classified into, for example, two classes (classes related to the state of the measurement object (machine)) indicating whether the measurement object is normal or abnormal. That is. Further, as the class classification other than the purpose, for example, a class relating to individual difference of the measurement object (machine) or a class relating to environment difference in which the measurement object (machine) is installed is classified. That is, in the present embodiment, by partially applying the NMF as described above, for example, the influence of the individual difference or the environmental difference of the measurement target is further suppressed, and the target measurement target is normal. It is possible to highly accurately extract the characteristics of the class indicating whether the class is present or abnormal.
(分離度)
そして、本実施形態においては、目的のクラス分類の分離度及び目的外クラス分類の分離度に基づいて、NMFを適用する領域(対象領域)の限定を行うこととなる。図7から図9を参照して、本実施形態に係るNMFを適用する対象領域の限定について説明する。図7は、本実施形態に係るデータ分割の例を示す説明図であって、詳細には、データ分割部216によるデータ分割と、分離度評価部218による教師データと評価データの取得の例を示す説明図である。また、図8及び図9は、本実施形態に係る教師データと評価データの取得の例を示す説明図である。
(Separation degree)
Then, in the present embodiment, the region (target region) to which NMF is applied is limited based on the degree of separation of the target class classification and the degree of separation of the non-target class classification. The limitation of the target area to which the NMF according to the present embodiment is applied will be described with reference to FIGS. 7 to 9. FIG. 7 is an explanatory diagram showing an example of data division according to the present embodiment, and more specifically, an example of data division by the
データ分割部216は、図7に示すように、例えば、教師データから得られた時間・周波数・振幅データ(非負の第2の教師データの観測行列)の領域A0(図8及び図9においては領域R80に対応する)において、4つの領域A1、A2、A3、A4にデータを分割する。データ分割部216による分割数は、2以上の任意の数であってもよい。
As shown in FIG. 7, the
そして、分離度評価部218は、例えば、分割された各領域A1、A2、A3、A4に対して、目的とするクラス(第1のクラス)のクラス間の分離度(第1の評価指数)として、クラス内・クラス間分散比を分離度として算出する。まずは、クラス内分散σw 2、及びクラス間分散σB 2は、以下の数式(7)、数式(8)によって示すことができる。
Then, the degree-of-
ただし、上記数式(7)、(8)において、nは全データ数、niはクラスiのデータ数、xは特徴ベクトル、miはクラスiの特徴量ベクトルの平均、mは全特徴量ベクトルの平均である。上記クラス内分散σw 2、及びクラス間分散σB 2を用いて、クラス内・クラス間分散比Jは以下の数式(9)によって示される。 However, the equation (7), in (8), n is the total number of data, n i is the number of data of the class i, x is a feature vector, m i is the average of the feature vectors of the class i, m is the total feature value It is the average of the vectors. Using the within-class variance σ w 2 and the between-class variance σ B 2 , the within-class/inter-class variance ratio J is expressed by the following mathematical expression (9).
上記のクラス内・クラス間分散比Jが大きい程、分離度が大きく、良い特徴量であると考えることができる。なお、分離度を示す指標は、上記に限定されず、例えばマハラノビス距離等を用いることもできる。 It can be considered that the larger the above-mentioned in-class/inter-class dispersion ratio J, the greater the degree of separation and the better the feature amount. The index indicating the degree of separation is not limited to the above, and for example, the Mahalanobis distance or the like can be used.
分離度評価部218は、例えば、4つの領域A1、A2、A3、A4でそれぞれ上述したように目的クラスについての分離度を算出する。さらに、分離度評価部218は、例えば、4つの領域A1、A2、A3、A4から算出した分離度の値が予め設定された閾値L1(第1の閾値)以上の領域(第1の領域)R10(図8 参照)を抽出する。
The degree-of-
上述と同様に、分離度評価部218は、例えば、分割された教師データから得られた時間・周波数・振幅データ(非負の第3の教師データの観測行列)の各領域A1、A2、A3、A4に対して、目的外クラス(第2のクラス)についての分離度(第2の評価指標)を算出する。さらに、分離度評価部218は、例えば、4つの領域A1、A2、A3、A4から算出した分離度の値が予め設定された閾値L2(第2の閾値)以上の領域(第2の領域)R12(図8 参照)を抽出する。なお、目的外クラスについては、2つ以上であってもよく、この場合、分離度評価部218は、例えば、分割された各領域A1、A2、A3、A4に対して他の目的外クラスについての分離度を算出し、4つの領域A1、A2、A3、A4から算出した分離度の値が予め設定された閾値L3以上の領域R14(図9 参照)を抽出することとなる。
In the same manner as described above, the
さらに、分離度評価部218は、抽出した領域R10、R12、R14に基づいて、NMFを適用する対象領域(所定の領域)を特定する。例えば、分離度評価部218は、抽出した領域R10、R12、R14の和、差、積のうちのいずれかに基づいて、NMFを適用する対象領域を特定する。具体的には、図8に示すように、分離度評価部218は、閾値L1以上の領域R10から、閾値L2以上の領域R12を除去することにより、NMFを適用する領域G810を特定する。また、目的外クラスが2つであった場合には、図9に示すように、分離度評価部218は、閾値L1以上の領域R10から、閾値L2以上の領域R12及び閾値L3以上の領域R14を除去することにより、NMFを適用する領域G820を特定する。すなわち、本実施形態においては、目的とするクラスの分離度の高い領域であり、且つ、目的外のクラスの分離度の高くない領域を選択することにより、目的のクラスの分類に有効な対象領域を効率よく見つけ出すことができる。
Further, the separation
そして、本実施形態においては、上述したように、目的のクラスの分離度の高い領域から目的外のクラスの分離度が高い領域を除去した対象領域に、NMFを適用することにより、より高い分離度を持つ、より精度の高い分類に有効な特徴量を得ることができる。 Then, in the present embodiment, as described above, by applying NMF to the target region obtained by removing the region having a high degree of separation of the non-target class from the region having a high degree of separation of the target class, a higher separation is achieved. It is possible to obtain a feature quantity that has a degree and is effective for more accurate classification.
そして、分離度評価部218は、学習フェーズにおいて、上述のように特定されたNMFを適用する対象領域での時間領域・周波数領域でのデータを教師用データ(非負の第1の教師データの教師観測行列)として取得する。さらに、分離度評価部218は、上述のように特定した時間領域・周波数領域を、評価データを取得するためのデータ領域(対象領域)として特定し、対応する当該データ領域の時間・周波数・振幅データを、評価用データ(非負の評価データの評価観測行列)として取得する。
Then, in the learning phase, the degree-of-
また、本実施形態においては、分離度としてクラス分類正解率を用いてもよい。詳細には、分離度評価部218は、図7に示すような分割されたそれぞれのデータに対して、NMFを適用し、ある複数のランクでの基底行列及び係数行列を取得する。なお、時間・周波数・振幅データは、NMFを適用するために、1次元の列ベクトルに変換されてもよい。
Further, in the present embodiment, the class classification correct answer rate may be used as the degree of separation. In detail, the
以下の例では、クラスC1とクラスC2の2つのクラスが存在する場合について説明する。まず、クラスC1に属する複数の時間・周波数・振幅データの領域A1、A2、A3、A4から、基底行列HC1,A1、HC1,A2、HC1,A3、HC1,A4、及び係数行列WC1,A1、WC1,A2、WC1,A3、WC1,A4、をそれぞれ得ることができる。続いて、クラスC2に属する複数の時間・周波数・振幅データの領域A1、A2、A3、A4から、同様に基底行列HC2,A1、HC2,A2、HC2,A3、HC2,A4、及び係数行列WC2,A1、WC2,A2、WC2,A3、WC2,A4、をそれぞれ得ることができる。なお、分解される基底の数を示すランクは、1から元のデータの次元数までの範囲である。 In the following example, a case where two classes C1 and C2 exist will be described. First, the basis matrices H C1, A1 , H C1, A2 , H C1, A3 , H C1, A4 , and the coefficient matrix are calculated from a plurality of time/frequency/amplitude data regions A1, A2, A3, A4 belonging to the class C1. It is possible to obtain W C1,A1 , W C1,A2 , W C1,A3 , W C1,A4 , respectively. Then, from the plurality of time/frequency/amplitude data regions A1, A2, A3, and A4 belonging to the class C2, the basis matrices H C2, A1 , H C2, A2 , H C2, A3 , H C2, A4 , And a coefficient matrix W C2,A1 , W C2,A2 , W C2,A3 , W C2,A4 , respectively. The rank indicating the number of decomposed bases ranges from 1 to the number of dimensions of the original data.
そして、ここでは、先に説明したように、クラスC1又はクラスC2の分離度を示す指標として、クラスC1又はクラスC2の分類正解率が用いられる。まず、分離度評価部218は、クラスC1、C2のそれぞれから得られた基底HC1,A1、HC2,A1を組み合わせた共通の基底HC1‐C2,A1={HC1,A1,HC2,A1}を算出する。元のクラスC1のデータYC1,A0、クラスC2のデータYC2,A0にHC1―C2,A1の擬似逆行列HC1―C2,A1 +をかけることにより、各クラスの係数行列WC1,A0、WC2,A0は、以下の数式(10)、(11)により示すことができる。
Then, as described above, the classification accuracy rate of the class C1 or the class C2 is used as the index indicating the degree of separation of the class C1 or the class C2. First, the degree-of-
分離度評価部218は、係数行列WC1,A0、WC2,A0を、それぞれクラスC1、クラスC2の特徴ベクトルとして、分類して、分類正解率を算出する。ここで分離度評価部218が行う分類の方式は、例えば分類部228の分類方式と同様であってもよい。
The separation
また、データ分割部216は、図7に示す4つの領域A1、A2、A3、A4のそれぞれにおいて、さらに再帰的にデータを分割してもよい。例えば、図7に示す領域A1は、4つの領域A11、A12、A13、A14に分割されてもよい。また、分離度評価部218は、分割されたデータや、分割されたデータを組み合わせたデータに対して、それぞれ分離度を算出することとなる。上記の再帰的な分割は、時間領域・周波数領域が最小の単位になるまで分割されるか、あるいは分割されたデータの大きさが所定の値となるまで、繰り返されてもよい。
The
なお、上述の説明では、分離度が高い時間領域・周波数領域を効率よく抽出するために、再帰的に分割する例を説明したが、本発明は係る例に限定されない。例えば、一部、あるいは全ての時間領域・周波数領域の分離度を評価してもよいし、他の方法で分離度の高い時間領域・周波数領域を抽出してもよい。 In the above description, an example of recursive division has been described in order to efficiently extract the time domain/frequency domain having a high degree of separation, but the present invention is not limited to this example. For example, the degree of separation in part or all of the time domain/frequency domain may be evaluated, or the time domain/frequency domain with high degree of separation may be extracted by another method.
<動作例>
以上、本実施形態の概要について説明した。続いて、本実施形態の動作(分類方法)の例について、学習フェーズと分類フェーズとに分けて、それぞれ図10、11を参照して説明する。図10は、学習フェーズにおける本実施形態の動作例を示すフローチャート図であり、図11は、分類フェーズにおける本実施形態の動作例を示すフローチャート図である。
<Operation example>
The outline of the present embodiment has been described above. Next, an example of the operation (classification method) of this embodiment will be described with reference to FIGS. 10 and 11, separately for the learning phase and the classification phase. FIG. 10 is a flowchart showing an operation example of this embodiment in the learning phase, and FIG. 11 is a flowchart showing an operation example of this embodiment in the classification phase.
(学習フェーズの動作例)
次に、本実施形態に係る学習フェーズの動作例の詳細について説明する。図10に示すように、当該学習フェーズには、例えば、ステップS101からステップS125までの複数のステップが含まれている。以下に、学習フェーズに含まれる各ステップの詳細を説明する。
(Example of operation in the learning phase)
Next, details of the operation example of the learning phase according to the present embodiment will be described. As shown in FIG. 10, the learning phase includes, for example, a plurality of steps from step S101 to step S125. The details of each step included in the learning phase will be described below.
〜ステップS101〜
データ取得部202は、センサ100から時系列データを取得する。この際、処理部210は、取得した時系列データからオフセット値を引く処理を行ってもよい。もしくは、処理部210は、後述するステップS107で変換された時間・周波数・振幅データに対する周波数フィルタリング処理等を行ってもよい。このようにすることで、NMFの対象となる時間・周波数・振幅データの精度や、分類に有効な特徴量の有効性をより高めることができる。
~ Step S101 ~
The
〜ステップS103〜
続いて、対応付け部214は、ステップS101で取得された時系列データと、操作部204を介してユーザにより入力される正解ラベル(目的クラス及び目的外クラス)とを対応付ける。
~ Step S103 ~
Subsequently, the associating
〜ステップS105〜
処理部210は、学習フェーズに用いられる時系列データの取得が終了したか否かの判定を行う。例えば、当該判定は、例えば操作部204の入力に基づいて行われてもよい。そして、学習フェーズに用いられる時系列データの取得が終了していない場合には、処理はステップS101に戻る。一方、学習フェーズに用いられる時系列データの取得が終了している場合には、処理はステップS107へ進む。
~ Step S105
The
〜ステップS107〜
変換部212は、ステップS103で取得した時系列データを時間・周波数・振幅データに変換する。
~ Step S107 ~
The
〜ステップS109〜
続いて、データ分割部216は、時間領域、及び周波数領域で、ステップS107で取得した時間・周波数・振幅データを分割する。
~ Step S109 ~
Subsequently, the
〜ステップS111〜
次に、分離度評価部218は、ステップS109でデータ分割部216により分割された領域ごとに、目的のクラスの分離度を評価する。
~ Step S111 ~
Next, the degree-of-
〜ステップS113〜
分離度評価部218は、ステップS109で分割された複数の領域の中から、ステップS111で評価した分離度の高い領域を抽出する。
~ Step S113 ~
The degree-of-
〜ステップS115〜
続いて、分離度評価部218は、ステップS109でデータ分割部216により分割された領域ごとに、目的外のクラスの分離度を評価する。
~ Step S115 ~
Subsequently, the separation
〜ステップS117〜
分離度評価部218は、ステップS109で分割された複数の領域の中から、ステップS115で評価した分離度の高い領域を抽出する。
~Step S117~
The degree-of-
〜ステップS119〜
分離度評価部218は、ステップS113で抽出された目的のクラスの分離度の高い領域から、ステップS117で抽出された目的外のクラスの分離度の高い領域を除外することにより、対象領域を特定する。
~Step S119~
The degree-of-
〜ステップS121〜
教師データ処理部220は、ステップS119で特定された対象領域の時間・周波数・振幅データ(教師データの教師観測行列)を取得する。
~ Step S121 ~
The teacher
〜ステップS123〜
教師データ処理部220は、ステップS121で取得された対象領域の時間・周波数・振幅データ(教師データの教師観測行列)にNMFを適用して、教師基底行列と教師係数行列とを取得する。
~ Step S123 ~
The teacher
〜ステップS125〜
さらに、パラメータ生成部222は、ステップS123で取得された教師係数行列と、ステップS103で対応付けられた正解ラベル(目的クラス)とに基づいて、分類モデルパラメータを生成する。
~ Step S125
Further, the
以上、学習フェーズにおける本実施形態の動作例を説明した。続いて、学習フェーズで生成された分類モデルパラメータを用いた、分類フェーズにおける本実施形態の動作例について、図11を参照して説明する。 The operation example of this embodiment in the learning phase has been described above. Next, an operation example of the present embodiment in the classification phase using the classification model parameter generated in the learning phase will be described with reference to FIG.
(分類フェーズの動作例)
次に、分類フェーズの動作例の詳細について説明する。図11に示すように、本実施形態に係る分類フェーズには、例えば、ステップS201からステップS215までの複数のステップが含まれている。以下に、分類フェーズに含まれる各ステップの詳細を説明する。
(Operation example of classification phase)
Next, details of an operation example of the classification phase will be described. As shown in FIG. 11, the classification phase according to this embodiment includes, for example, a plurality of steps from step S201 to step S215. The details of each step included in the classification phase will be described below.
〜ステップS201〜
データ取得部202は、時系列データを取得する。この際、処理部210は、取得した時系列データからオフセット値を引く処理を行ってもよい。もしくは、処理部210は、後述するステップS107で変換された時間・周波数・振幅データに対する周波数フィルタリング処理等を行ってもよい。このようにすることで、NMFの対象となる時間・周波数・振幅データの精度や、分類の精度をより高めることができる。
~ Step S201 ~
The
〜ステップS203〜
変換部212は、ステップS201で取得した時系列データを時間・周波数・振幅データに変換する。
~Step S203~
The
〜ステップS205〜
続いて、データ分割部216は、時間領域、及び周波数領域で、ステップS203で取得した時間・周波数・振幅データを分割する。
~ Step S205
Subsequently, the
〜ステップS207〜
続いて、分離度評価部218は、ステップS205で分割された時間・周波数・振幅データから、図10を参照して説明した学習フェーズのステップS119で特定された対象領域と同一の領域を特定する。
~Step S207~
Subsequently, the
〜ステップS209〜
さらに、特徴抽出部226は、ステップS207で特定された対象領域の時間・周波数・振幅データ(評価データの評価観測行列)を取得する。
~ Step S209 ~
Further, the
〜ステップS211〜
続いて、特徴抽出部226は、上述した学習フェーズのステップS123で取得された教師基底行列に基づいて、ステップS209で取得した対象領域の時間・周波数・振幅データ(評価データの評価観測行列)から評価係数行列を生成する。
~ Step S211 ~
Subsequently, the
〜ステップS213〜
続いて、分類部228は、上述した学習フェーズのステップS125で生成された分類モデルパラメータに基づいて、ステップS211で生成した評価係数行列を分類する。
~Step S213~
Subsequently, the
〜ステップS215〜
最後に、出力部230は、ステップS213における分類結果を出力する。
~ Step S215 ~
Finally, the
<<まとめ>>
以上説明したように、本発明の実施形態においては、分類の精度をより向上させるために、目的とするクラス分類に有効な時間領域と周波数領域に限定するだけでなく、目的外のクラス分類に有効な時間領域と周波数領域を除外した上で部分的にNMFを適用する。すなわち、本実施形態によれば、目的のクラス分離度が高く、且つ、目的外のクラス分離度が高くない領域に限定してNMFを適用することにより、目的外のクラスの特徴に邪魔されることなく、分類したい目的のクラスの分類に有効な特徴をより高精度に抽出したり(言い換えると、目的のクラスの分類に有効な基底が選択されやすくなる)、目的のクラスに、より高精度に分類したりすることができる。その結果、本実施形態においては、分類の精度をより向上させることができる。加えて、本実施形態においては、領域を限定してNMFを適用すればよいため、処理量の抑制をさらに進めることもできる。
<<Summary>>
As described above, in the embodiment of the present invention, in order to further improve the accuracy of the classification, not only the time domain and the frequency domain effective for the target class classification but also the non-target class classification The NMF is partially applied after excluding the effective time domain and frequency domain. That is, according to the present embodiment, by applying the NMF only to the region where the target class separation is high and the non-target class separation is not high, the characteristics of the non-target class are disturbed. Without extracting the features that are effective in classifying the target class that you want to classify with higher accuracy (in other words, it becomes easier to select the bases that are effective in classifying the target class), and with higher accuracy in the target class. Can be classified into. As a result, in this embodiment, the accuracy of classification can be further improved. In addition, in the present embodiment, since it is sufficient to limit the area and apply the NMF, it is possible to further suppress the processing amount.
また、上述した実施形態においては、測定対象物(例えばコンクリート等)に対してハンマー等の打具で打撃した際の打音を収音して得られた音響信号(時系列データ)に基づいて、当該測定対象物が正常であるか異常であるかを示す2つのクラス(目的とする第1のクラス)に分類する例について説明した。しかしながら、本発明の実施形態は、上述の例に限定されるものではなく、例えば、3つ以上のクラスに分類してもよく、測定対象物(例えば、工作機械等)の振動の時系列データに基づいて、当該測定対象物の状態や能力を複数のクラスに分類してもよい。また、本発明の実施形態は、対象となる時系列データは特に限定されるものではなく、時間とともに変化する画像データ、環境温度、流量等のデータであってもよく、時間とともに変化する電気的なデータ(例えば、電圧値、電流値等)、測定対象物(例えば、建築物、機械、人、ボール、移動体(自動車)等)のモーションデータ、人間等の身体から得られる各種の生体情報(例えば、脈拍、心拍、体温、脳波等)であってもよい。すなわち、本発明の実施形態は、様々な機械や、人間の診断等に適用することが可能である。 Further, in the above-described embodiment, based on the acoustic signal (time-series data) obtained by collecting the hitting sound when hitting the object to be measured (for example, concrete) with a hitting tool such as a hammer. An example in which the measurement target is classified into two classes (first target class) indicating whether the measurement target is normal or abnormal has been described. However, the embodiment of the present invention is not limited to the above-mentioned example, and may be classified into, for example, three or more classes, and time series data of vibration of a measurement object (for example, a machine tool). Based on, the state and ability of the measurement object may be classified into a plurality of classes. Further, in the embodiment of the present invention, the target time-series data is not particularly limited, and may be image data that changes with time, data such as environmental temperature, flow rate, or the like. Data (for example, voltage value, current value, etc.), motion data of measurement target (for example, building, machine, person, ball, moving body (automobile), etc.), various biological information obtained from human body (For example, pulse, heartbeat, body temperature, brain wave, etc.) may be used. That is, the embodiments of the present invention can be applied to various machines, human diagnosis, and the like.
<<ハードウェア構成>>
以上、本発明の実施形態を説明した。上述した前処理、教師データ処理、パラメータ生成処理、特徴抽出処理、分類処理などの情報処理は、ソフトウェアと、情報処理装置200のハードウェアとの協働により実現される。以下では、本発明の実施形態に係る情報処理装置200である情報処理装置200のハードウェア構成例として、情報処理装置1000のハードウェア構成例について説明する。
<<Hardware configuration>>
The embodiments of the present invention have been described above. Information processing such as the above-described preprocessing, teacher data processing, parameter generation processing, feature extraction processing, and classification processing is realized by cooperation of software and hardware of the
図12は、本発明の実施形態に係る情報処理装置1000のハードウェア構成例を示す説明図である。図12に示すように、情報処理装置1000は、CPU(Central Processing Unit)1001と、ROM(Read Only Memory)1002と、RAM(Random Access Memory)1003と、入力装置1004と、出力装置1005と、ストレージ装置1006と、通信装置1007とを備える。
FIG. 12 is an explanatory diagram showing a hardware configuration example of the
CPU1001は、演算処理装置及び制御装置として機能し、各種プログラムに従って情報処理装置1000内の動作全般を制御する。また、CPU1001は、マイクロプロセッサであってもよい。ROM1002は、CPU1001が使用するプログラムや演算パラメータ等を格納する。RAM1003は、CPU1001の実行において使用するプログラムや、その実行において適宜変化するパラメータなどを一時記憶する。これらはCPUバスなどから構成されるホストバスにより相互に接続されている。主に、CPU1001、ROM1002及びRAM1003とソフトウェアとの協働により、例えば、処理部210、教師データ処理部220、パラメータ生成部222、特徴抽出部226、分類部228等の機能が実現される。
The
入力装置1004は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチ及びレバーなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、CPU1001に出力する入力制御回路などから構成されている。情報処理装置1000のユーザは、該入力装置1004を操作することにより、情報処理装置1000に対して各種のデータを入力したり処理動作を指示したりすることができる。なお、入力装置1004は、操作部204に対応する。
The
出力装置1005は、例えば、液晶ディスプレイ(LCD)装置、OLED(Organic Light Emitting Diode)装置及びランプなどの表示装置を含む。さらに、出力装置1005は、スピーカ及びヘッドホンなどの音声出力装置を含む。例えば、表示装置は、撮像された画像や生成された画像などを表示する。一方、音声出力装置は、音声データ等を音声に変換して出力する。なお、出力装置1005は、出力部230に対応する。
The
ストレージ装置1006は、データ格納用の装置である。ストレージ装置1006は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置及び記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。ストレージ装置1006は、CPU1001が実行するプログラムや各種データを格納する。なお、ストレージ装置1006は、記憶部224に対応する。
The
通信装置1007は、例えば、通信網に接続するための通信デバイスなどで構成された通信インタフェースである。また、通信装置1007は、無線LAN(Local Area Network)対応通信装置、LTE(Long Term Evolution)対応通信装置、有線による通信を行うワイヤー通信装置、またはブルートゥース(登録商標)通信装置を含んでもよい。
The
<<補足>>
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
<<Supplement>>
The preferred embodiments of the present invention have been described above in detail with reference to the accompanying drawings, but the present invention is not limited to these examples. It is obvious that a person having ordinary knowledge in the technical field to which the present invention pertains can come up with various changes or modifications within the scope of the technical idea described in the claims. Of course, it is understood that these also belong to the technical scope of the present invention.
例えば、上記実施形態では、教師データと、評価データとを同一の装置(情報処理装置200)が取得する例を説明したが、本発明は係る例に限定されない。例えば、教師データと評価データを取得する装置は別々の装置であってもよいし、教師データや正解ラベルは、予め記憶部224に格納されていてもよい。すなわち、上述の実施形態では、情報処理装置200が、分類モデルパラメータを生成するパラメータ生成装置としての機能と、時系列データを複数のクラスに分類する分類装置としての機能とを有する例を説明したが、本発明は係る例に限定されない。例えば、本実施形態においては、分類モデルパラメータの生成処理を行うパラメータ生成装置と、パラメータ生成装置で生成された分類モデルパラメータを用いて分類処理を行う分類装置とが、異なる装置として設けられてもよい。
For example, in the above embodiment, an example in which the same device (information processing device 200) acquires the teacher data and the evaluation data has been described, but the present invention is not limited to this example. For example, the device that acquires the teacher data and the evaluation data may be separate devices, and the teacher data and the correct answer label may be stored in the
また、上述の実施形態は、例えば、コンピュータを本実施形態に係る情報処理装置200として機能させるため(本実施形態に係る分類方法を実施するため)のプログラム、及びプログラムが記録された一時的でない有形の媒体を含みうる。また、プログラムをインターネット等の通信回線(無線通信も含む)を介して頒布してもよい。
Further, the above-described embodiment is, for example, a program for causing a computer to function as the
また、本実施形態の動作(分類方法)における処理ステップは、必ずしもフローチャートに記載された順序に沿って時系列に実行されなくてよい。例えば、本実施形態においては、処理ステップは、フローチャートとして記載した順序と異なる順序で実行されても、並列的に実行されてもよい。 Further, the processing steps in the operation (classification method) of the present embodiment do not necessarily have to be executed in time series in the order described in the flowchart. For example, in the present embodiment, the processing steps may be executed in an order different from the order described as the flowchart, or may be executed in parallel.
10 情報処理システム
100 センサ
200、1000 情報処理装置
200a クラウド
200b IoTゲートウェイ
200c エッジ端末
202 データ取得部
204 操作部
210 処理部
212 変換部
214 対応付け部
216 データ分割部
218 分離度評価部
220 教師データ処理部
222 パラメータ生成部
224 記憶部
226 特徴抽出部
228 分類部
230 出力部
1001 CPU
1002 ROM
1003 RAM
1004 入力装置
1005 出力装置
1006 ストレージ装置
1007 通信装置
10
1002 ROM
1003 RAM
1004
Claims (4)
少なくとも周波数領域又は時間領域において表現された前記時系列データから、所定のデータ領域の非負の評価データを取得する処理部と、
前記所定のデータ領域に対応する非負の第1の教師データに対して非負値行列因子分解を行うことで生成された教師係数行列、及び、前記第1の教師データに対応付けられた前記第1のクラスに基づいて生成された分類モデルパラメータを格納する記憶部と、
前記第1の教師データに対して非負値行列因子分解を行うことで生成された教師基底行列に基づいて、前記評価データから評価係数行列を生成する特徴抽出部と、
算出された前記評価係数行列を、前記分類モデルパラメータに基づいて、前記第1のクラスに分類する分類部と、
前記所定のデータ領域を特定する領域特定部と、
を備え、
前記領域特定部は、
前記第1のクラスのそれぞれに対応付けられた非負の各第2の教師データを、周波数領域又は時間領域においてそれぞれ分割し、
分割された領域ごとの前記各第2の教師データの観測行列に基づいて、前記分割された領域ごとの前記第1のクラス間の分離度を示す第1の評価指標を算出し、
目的としない第2のクラスのそれぞれに対応付けられた非負の各第3の教師データを、周波数領域又は時間領域においてそれぞれ分割し、
分割された領域ごとの前記各第3の教師データの観測行列に基づいて、前記分割された領域ごとの前記第2のクラス間の分離度を示す第2の評価指標を算出し、
前記第1の評価指標が予め設定された第1の閾値よりも高い、前記分割された領域を抽出することにより、第1の領域を特定し、
前記第2の評価指標が予め設定された第2の閾値よりも高い、前記分割された領域を抽出することにより、第2の領域を特定し、
特定した前記第1及び第2の領域に基づいて、前記所定のデータ領域を特定する、
分類装置。 A classifying device for classifying time series data into a desired first class,
From the time series data expressed in at least the frequency domain or the time domain, a processing unit that acquires non-negative evaluation data in a predetermined data domain,
A teacher coefficient matrix generated by performing non-negative matrix factorization on the non-negative first teacher data corresponding to the predetermined data area, and the first teacher data associated with the first teacher data. A storage unit for storing classification model parameters generated based on the class of
A feature extraction unit that generates an evaluation coefficient matrix from the evaluation data based on a teacher basis matrix generated by performing non-negative matrix factorization on the first teacher data;
A classification unit that classifies the calculated evaluation coefficient matrix into the first class based on the classification model parameters;
An area specifying unit for specifying the predetermined data area,
Equipped with
The area specifying unit,
Each non-negative second teacher data associated with each of the first classes is divided in the frequency domain or the time domain,
Calculating a first evaluation index indicating the degree of separation between the first classes for each of the divided regions, based on the observation matrix of each of the second teacher data for each of the divided regions,
Each non-negative third teacher data associated with each second target class is divided in the frequency domain or the time domain,
Calculating a second evaluation index indicating the degree of separation between the second classes for each of the divided regions, based on the observation matrix of each of the third teacher data for each of the divided regions,
The first evaluation index is higher than a preset first threshold value, the first area is specified by extracting the divided area,
The second area is specified by extracting the divided area in which the second evaluation index is higher than a preset second threshold value,
Specifying the predetermined data area based on the specified first and second areas;
Classifier.
前記時系列データを取得するセンサと、
を含む分類システムであって、
前記分類装置は、
少なくとも周波数領域又は時間領域において表現された前記時系列データから、所定のデータ領域の非負の評価データを取得する処理部と、
前記所定のデータ領域に対応する非負の第1の教師データに対して非負値行列因子分解を行うことで生成された教師係数行列、及び、前記第1の教師データに対応付けられた前記第1のクラスに基づいて生成された分類モデルパラメータを格納する記憶部と、
前記第1の教師データに対して非負値行列因子分解を行うことで生成された教師基底行列に基づいて、前記評価データから評価係数行列を生成する特徴抽出部と、
算出された前記評価係数行列を、前記分類モデルパラメータに基づいて、前記第1のクラスに分類する分類部と、
前記所定のデータ領域を特定する領域特定部と、
を有し、
前記領域特定部は、
前記第1のクラスのそれぞれに対応付けられた非負の各第2の教師データを、周波数領域又は時間領域においてそれぞれ分割し、
分割された領域ごとの前記各第2の教師データの観測行列に基づいて、前記分割された領域ごとの前記第1のクラス間の分離度を示す第1の評価指標を算出し、
目的としない第2のクラスのそれぞれに対応付けられた非負の各第3の教師データを、周波数領域又は時間領域においてそれぞれ分割し、
分割された領域ごとの前記各第3の教師データの観測行列に基づいて、前記分割された領域ごとの前記第2のクラス間の分離度を示す第2の評価指標を算出し、
前記第1の評価指標が予め設定された第1の閾値よりも高い、前記分割された領域を抽出することにより、第1の領域を特定し、
前記第2の評価指標が予め設定された第2の閾値よりも高い、前記分割された領域を抽出することにより、第2の領域を特定し、
特定した前記第1及び第2の領域に基づいて、前記所定のデータ領域を特定する、
分類システム。 A classifying device for classifying the time series data into a target first class;
A sensor for acquiring the time series data,
A classification system including
The classification device is
From the time series data expressed in at least the frequency domain or the time domain, a processing unit that acquires non-negative evaluation data in a predetermined data domain,
A teacher coefficient matrix generated by performing non-negative matrix factorization on the non-negative first teacher data corresponding to the predetermined data area, and the first teacher data associated with the first teacher data. A storage unit for storing classification model parameters generated based on the class of
A feature extraction unit that generates an evaluation coefficient matrix from the evaluation data based on a teacher basis matrix generated by performing non-negative matrix factorization on the first teacher data;
A classification unit that classifies the calculated evaluation coefficient matrix into the first class based on the classification model parameters;
An area specifying unit for specifying the predetermined data area,
Have
The area specifying unit,
Each non-negative second teacher data associated with each of the first classes is divided in the frequency domain or the time domain,
Calculating a first evaluation index indicating the degree of separation between the first classes for each of the divided regions, based on the observation matrix of each of the second teacher data for each of the divided regions,
Each non-negative third teacher data associated with each second target class is divided in the frequency domain or the time domain,
Calculating a second evaluation index indicating the degree of separation between the second classes for each of the divided regions, based on the observation matrix of each of the third teacher data for each of the divided regions,
The first evaluation index is higher than a preset first threshold value, the first area is specified by extracting the divided area,
The second area is specified by extracting the divided area in which the second evaluation index is higher than a preset second threshold value,
Specifying the predetermined data area based on the specified first and second areas;
Classification system.
少なくとも周波数領域又は時間領域において表現された前記時系列データから、所定のデータ領域の非負の評価データを取得することと、
前記所定のデータ領域に対応する非負の第1の教師データに対して非負値行列因子分解を行うことで生成された教師係数行列、及び、前記第1の教師データに対応付けられた前記第1のクラスに基づいて生成された分類モデルパラメータを格納することと、
前記第1の教師データに対して非負値行列因子分解を行うことで生成された教師基底行列に基づいて、前記評価データから評価係数行列を生成することと、
算出された前記評価係数行列を、前記分類モデルパラメータに基づいて、前記第1のクラスに分類することと、
前記所定のデータ領域を特定することと、
を含み、
前記所定のデータ領域を特定することは、
前記第1のクラスのそれぞれに対応付けられた非負の各第2の教師データを、周波数領域又は時間領域においてそれぞれ分割し、
分割された領域ごとの前記各第2の教師データの観測行列に基づいて、前記分割された領域ごとの前記第1のクラス間の分離度を示す第1の評価指標を算出し、
目的としない第2のクラスのそれぞれに対応付けられた非負の各第3の教師データを、周波数領域又は時間領域においてそれぞれ分割し、
分割された領域ごとの前記各第3の教師データの観測行列に基づいて、前記分割された領域ごとの前記第2のクラス間の分離度を示す第2の評価指標を算出し、
前記第1の評価指標が予め設定された第1の閾値よりも高い、前記分割された領域を抽出することにより、第1の領域を特定し、
前記第2の評価指標が予め設定された第2の閾値よりも高い、前記分割された領域を抽出することにより、第2の領域を特定し、
特定した前記第1及び第2の領域に基づいて、前記所定のデータ領域を特定する、
ことを有する、
分類方法。 A classification method for classifying time series data into a desired first class,
From the time series data expressed in at least the frequency domain or the time domain, obtaining non-negative evaluation data in a predetermined data domain,
A teacher coefficient matrix generated by performing non-negative matrix factorization on the non-negative first teacher data corresponding to the predetermined data area, and the first teacher data associated with the first teacher data. Storing classification model parameters generated based on the class of
Generating an evaluation coefficient matrix from the evaluation data based on a teacher basis matrix generated by performing non-negative matrix factorization on the first teacher data;
Classifying the calculated evaluation coefficient matrix into the first class based on the classification model parameters;
Specifying the predetermined data area,
Including
Specifying the predetermined data area is
Each non-negative second teacher data associated with each of the first classes is divided in the frequency domain or the time domain,
Calculating a first evaluation index indicating the degree of separation between the first classes for each of the divided regions, based on the observation matrix of each of the second teacher data for each of the divided regions,
Each non-negative third teacher data associated with each second target class is divided in the frequency domain or the time domain,
Calculating a second evaluation index indicating the degree of separation between the second classes for each of the divided regions, based on the observation matrix of each of the third teacher data for each of the divided regions,
The first evaluation index is higher than a preset first threshold value, the first area is specified by extracting the divided area,
The second area is specified by extracting the divided area in which the second evaluation index is higher than a preset second threshold value,
Specifying the predetermined data area based on the specified first and second areas;
Having
Classification method.
コンピュータに、
少なくとも周波数領域又は時間領域において表現された前記時系列データから、所定のデータ領域の非負の評価データを取得する機能と、
前記所定のデータ領域に対応する非負の第1の教師データに対して非負値行列因子分解を行うことで生成された教師係数行列、及び、前記第1の教師データに対応付けられた前記第1のクラスに基づいて生成された分類モデルパラメータを格納する機能と、
前記第1の教師データに対して非負値行列因子分解を行うことで生成された教師基底行列に基づいて、前記評価データから評価係数行列を生成する機能と、
算出された前記評価係数行列を、前記分類モデルパラメータに基づいて、前記第1のクラスに分類する機能と、
前記所定のデータ領域を特定する機能と、
を実現させ、
前記所定のデータ領域を特定する機能においては、
前記第1のクラスのそれぞれに対応付けられた非負の各第2の教師データを、周波数領域又は時間領域においてそれぞれ分割し、
分割された領域ごとの前記各第2の教師データの観測行列に基づいて、前記分割された領域ごとの前記第1のクラス間の分離度を示す第1の評価指標を算出し、
目的としない第2のクラスのそれぞれに対応付けられた非負の各第3の教師データを、周波数領域又は時間領域においてそれぞれ分割し、
分割された領域ごとの前記各第3の教師データの観測行列に基づいて、前記分割された領域ごとの前記第2のクラス間の分離度を示す第2の評価指標を算出し、
前記第1の評価指標が予め設定された第1の閾値よりも高い、前記分割された領域を抽出することにより、第1の領域を特定し、
前記第2の評価指標が予め設定された第2の閾値よりも高い、前記分割された領域を抽出することにより、第2の領域を特定し、
特定した前記第1及び第2の領域に基づいて、前記所定のデータ領域を特定する、
ことを実施する、
プログラム。 A program for classifying time series data into a desired first class,
On the computer,
From the time series data expressed in at least the frequency domain or the time domain, a function of acquiring non-negative evaluation data in a predetermined data domain,
A teacher coefficient matrix generated by performing non-negative matrix factorization on the non-negative first teacher data corresponding to the predetermined data area, and the first teacher data associated with the first teacher data. The ability to store the classification model parameters generated based on the class of
A function of generating an evaluation coefficient matrix from the evaluation data based on a teacher basis matrix generated by performing non-negative matrix factorization on the first teacher data;
A function of classifying the calculated evaluation coefficient matrix into the first class based on the classification model parameter;
A function for specifying the predetermined data area,
Is realized,
In the function of specifying the predetermined data area,
Each non-negative second teacher data associated with each of the first classes is divided in the frequency domain or the time domain,
Calculating a first evaluation index indicating the degree of separation between the first classes for each of the divided regions, based on the observation matrix of each of the second teacher data for each of the divided regions,
Each non-negative third teacher data associated with each second target class is divided in the frequency domain or the time domain,
Calculating a second evaluation index indicating the degree of separation between the second classes for each of the divided regions, based on the observation matrix of each of the third teacher data for each of the divided regions,
The first evaluation index is higher than a preset first threshold value, the first area is specified by extracting the divided area,
The second area is specified by extracting the divided area in which the second evaluation index is higher than a preset second threshold value,
Specifying the predetermined data area based on the specified first and second areas;
Do things,
program.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018246147A JP7263770B2 (en) | 2018-12-27 | 2018-12-27 | Classification device, classification system, classification method and program |
PCT/JP2019/044697 WO2020137227A1 (en) | 2018-12-27 | 2019-11-14 | Classification device, classification system, classification method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018246147A JP7263770B2 (en) | 2018-12-27 | 2018-12-27 | Classification device, classification system, classification method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020107138A true JP2020107138A (en) | 2020-07-09 |
JP7263770B2 JP7263770B2 (en) | 2023-04-25 |
Family
ID=71126411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018246147A Active JP7263770B2 (en) | 2018-12-27 | 2018-12-27 | Classification device, classification system, classification method and program |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7263770B2 (en) |
WO (1) | WO2020137227A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115915456A (en) * | 2022-11-08 | 2023-04-04 | 南京邮电大学 | WIFI 6-based transformer substation data uploading method |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017151872A (en) * | 2016-02-26 | 2017-08-31 | 沖電気工業株式会社 | Classification device, classification method, program and parameter creation device |
WO2018051841A1 (en) * | 2016-09-16 | 2018-03-22 | 日本電信電話株式会社 | Model learning device, method therefor, and program |
-
2018
- 2018-12-27 JP JP2018246147A patent/JP7263770B2/en active Active
-
2019
- 2019-11-14 WO PCT/JP2019/044697 patent/WO2020137227A1/en active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017151872A (en) * | 2016-02-26 | 2017-08-31 | 沖電気工業株式会社 | Classification device, classification method, program and parameter creation device |
WO2018051841A1 (en) * | 2016-09-16 | 2018-03-22 | 日本電信電話株式会社 | Model learning device, method therefor, and program |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115915456A (en) * | 2022-11-08 | 2023-04-04 | 南京邮电大学 | WIFI 6-based transformer substation data uploading method |
Also Published As
Publication number | Publication date |
---|---|
JP7263770B2 (en) | 2023-04-25 |
WO2020137227A1 (en) | 2020-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6766374B2 (en) | Classification device, classification method, program, and parameter generator | |
JP6692488B2 (en) | Method and active learning system for training a neuron network | |
Machado et al. | Human activity data discovery from triaxial accelerometer sensor: Non-supervised learning sensitivity to feature extraction parametrization | |
JP4769342B2 (en) | Tactile sensation reproduction method, apparatus, computer program, and recording medium recording the computer program | |
EP3047475B1 (en) | System and method for evaluating a cognitive load on a user corresponding to a stimulus | |
KR101293446B1 (en) | Electroencephalography Classification Method for Movement Imagination and Apparatus Thereof | |
CN110367976B (en) | Brain wave signal detection method, related device and storage medium | |
Li et al. | High-resolution time-frequency analysis of EEG signals using multiscale radial basis functions | |
CN110414306B (en) | Baby abnormal behavior detection method based on meanshift algorithm and SVM | |
Pfister et al. | Robustifying independent component analysis by adjusting for group-wise stationary noise | |
JP2016197406A5 (en) | ||
Hariharan et al. | A new feature constituting approach to detection of vocal fold pathology | |
Sharma et al. | Trbaggboost: An ensemble-based transfer learning method applied to Indian Sign Language recognition | |
Sideridis et al. | Gesturekeeper: Gesture recognition for controlling devices in iot environments | |
WO2020137227A1 (en) | Classification device, classification system, classification method, and storage medium | |
JP6747447B2 (en) | Signal detection device, signal detection method, and signal detection program | |
CN113963193A (en) | Method and device for generating vehicle body color classification model and storage medium | |
CN107894837A (en) | Dynamic sentiment analysis model sample processing method and processing device | |
Railis et al. | Energy profile analysis of Zynq-7000 programmable SoC for embedded medical processing: Study on ECG arrhythmia detection | |
JP5846165B2 (en) | Feature amount extraction apparatus, method, and program | |
JP6573399B2 (en) | Sensory relevance distribution map generation device for phonetic symbolic words | |
CN115132324A (en) | Mental health prediction method and device, electronic equipment and storage medium | |
JP2012181607A (en) | Sensory data identification apparatus and program | |
JP2022129136A (en) | Processing device, processing method and program | |
CN112861679A (en) | Transfer learning method and system for behavior recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20190327 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190328 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221011 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230314 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230327 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7263770 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |