WO2021044626A1 - 特徴量抽出装置、時系列データ解析システム、方法およびプログラム - Google Patents

特徴量抽出装置、時系列データ解析システム、方法およびプログラム Download PDF

Info

Publication number
WO2021044626A1
WO2021044626A1 PCT/JP2019/035254 JP2019035254W WO2021044626A1 WO 2021044626 A1 WO2021044626 A1 WO 2021044626A1 JP 2019035254 W JP2019035254 W JP 2019035254W WO 2021044626 A1 WO2021044626 A1 WO 2021044626A1
Authority
WO
WIPO (PCT)
Prior art keywords
series data
feature amount
time series
time
input
Prior art date
Application number
PCT/JP2019/035254
Other languages
English (en)
French (fr)
Inventor
一徳 三好
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2021543925A priority Critical patent/JPWO2021044626A1/ja
Priority to PCT/JP2019/035254 priority patent/WO2021044626A1/ja
Priority to US17/640,136 priority patent/US20220300833A1/en
Publication of WO2021044626A1 publication Critical patent/WO2021044626A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Definitions

  • the present invention includes a feature amount extraction device that extracts a feature amount from time-series data, a feature amount extraction method and a feature amount extraction program, and a time-series data analysis system that analyzes time-series data using the extracted feature amount. Regarding the time series data analysis method.
  • Time-series data is a series of values obtained by measuring temporal changes in a phenomenon continuously or at predetermined intervals, and includes various features such as the measured values themselves and changes in values. It is data. Therefore, it is difficult to manually analyze the similarity / heterogeneity of any two time-series data and extract the features from the time-series data. Therefore, various methods have been proposed in which all or part of the time-series data is extracted, the similarity and heterogeneity of the two time-series data are analyzed, and the feature amount is extracted.
  • Patent Document 1 describes a device that extracts the characteristics of a one-dimensional time series signal.
  • the apparatus described in Patent Document 1 analyzes a one-dimensional time series signal based on a recurrence plot method, calculates a higher-order local autocorrelation coefficient from a two-dimensional image generated by the recurrence plot method, and extracts features. ..
  • a method for analyzing quantitative time series data using a recurrence plot is disclosed in Non-Patent Document 1 and the like.
  • the recurrence plot is a diagram used in statistics and chaos theory, and is a plot in which the times when the values become almost equal at a certain time are plotted as points.
  • the recurrence plot is used to discriminate stationarity (weak stationarity) or non-stationarity of time series data.
  • Patent Document 2 describes a method of generating a feature amount for classifying an identification target into a predetermined class by using a plurality of time series data. Further, in Patent Document 2, when identifying the time change of data, a secondary feature amount calculated by statistical processing is generated for the input data of each multidimensional dimension, and a neural network, a support vector machine, or the like is used. It is described that the machine learning is performed by inputting to the classifier.
  • the threshold value is calculated from the histogram of the two-dimensional image generated by the analysis of the one-dimensional time series signal. Then, the binary image information is generated by converting the two-dimensional image information into binary information based on the obtained threshold value.
  • the order is limited to the second order and the displacement direction is limited to the 3 ⁇ 3 region. Therefore, there is a problem that the number of feature dimensions increases exponentially according to the area size.
  • Non-Patent Document 1 since the information obtained by the recurrence plot described in Non-Patent Document 1 is only fragmentary data of the time series data, it cannot be said that the feature amount can be sufficiently extracted from the time series data.
  • the data to be identified is converted into pattern data, and the pattern data is input to the classifier to perform predetermined identification.
  • the feature amount is generated by paying attention to the feature possessed by each vertex in the time series data, it cannot be said that other information can be reflected in the feature amount. .. Therefore, it is preferable to be able to generate features representing a global structure in consideration of stationarity and the like shown by time series data, instead of features obtained only from individual vertices.
  • the present invention provides a feature quantity extraction device, a time series data analysis system, a feature quantity extraction method, a time series data analysis method, and a feature quantity extraction program that can extract a feature quantity representing a global structure from time series data.
  • the purpose is.
  • the feature amount extraction device is characterized by including a feature amount extraction unit that extracts the feature amount indicated by the time series data by machine learning using a recurrence plot created from the time series data.
  • the time-series data analysis system includes the above-mentioned feature quantity extraction device and an analysis device for analyzing time-series data, and the analysis device includes an analysis target input unit that accepts input of time-series data to be analyzed. , It is characterized by including a creation unit that creates a recurrence plot from time series data and a result output unit that outputs the analysis result of the input time series data using the feature quantity extracted by the feature quantity extraction unit. And.
  • the feature amount extraction method according to the present invention is characterized in that a computer extracts the feature amount indicated by the time series data by machine learning using a recurrence plot created from the time series data.
  • the time-series data analysis method extracts the feature amount indicated by the time-series data by the above-mentioned feature amount extraction method, accepts the input of the time-series data to be analyzed, and creates a recurrence plot from the time-series data. , It is characterized in that the analysis result of the input time series data is output using the extracted feature amount.
  • the feature amount extraction program according to the present invention is characterized in that a computer executes a feature amount extraction process for extracting the feature amount indicated by the time series data by machine learning using a recurrence plot created from the time series data. To do.
  • a feature quantity representing a global structure can be extracted from time series data.
  • FIG. 1 is a block diagram showing a configuration example of an embodiment of a time series data analysis system according to the present invention.
  • the time-series data analysis system 100 of the present embodiment includes a feature amount extraction device 10 and an analysis device 20.
  • the feature amount extraction device 10 is a device that extracts the feature amount of time series data.
  • the feature amount extraction device 10 of the present embodiment includes an input unit 11, a recurrence plot creation unit 12, a feature amount extraction unit 13, and a storage unit 14.
  • the input unit 11 accepts the input of time series data.
  • the dimension of the time series data to be accepted is arbitrary, and may be two-dimensional or three-dimensional or more.
  • the input unit 11 may accept the input of the time-series data stored in the storage unit 14.
  • the input unit 11 may accept the input of the time series data from the external storage through the communication line.
  • the input unit 11 may directly accept the input of the recurrence plot created from the time series data.
  • the feature amount extraction device 10 does not have to include the recurrence plot creation unit 12 described later.
  • the recurrence plot creation unit 12 creates a recurrence plot from the input time series data.
  • the method of creating a recurrence plot from time series data is widely known, and detailed description is omitted.
  • the recurrence plot creation unit 12 may create a plurality of recurrence plots for each of a plurality of conditions in which the embedding dimension and the delay amount are changed with respect to the input time series data. In this way, the recurrence plot creation unit 12 creates a plurality of recurrence plots from the same type of time series data by creating a recurrence plot for the same time series data for each of a plurality of conditions having different contents. Will be possible.
  • the feature amount extraction unit 13 extracts the feature amount indicated by the time series data by machine learning using the recurrence plot. Specifically, the feature amount extraction unit 13 extracts the feature amount indicated by the time series data by extracting the feature amount from the recurrence plot by the same method as the method of performing image recognition by machine learning.
  • the feature amount extraction unit 13 uses these.
  • the features indicated by the time series data may be extracted by machine learning using a plurality of recurrence plots. Machine learning using such a plurality of recurrence plots makes it possible to extract expected features from the same type of time series data.
  • the feature amount extraction unit 13 may generate a model for identifying the recurrence plot (more specifically, time series data) as well as extracting the feature amount by machine learning.
  • the content of machine learning performed by the feature amount extraction unit 13 is arbitrary, and examples thereof include principal component analysis, heterogeneous mixture learning, and neural networks.
  • the storage unit 14 stores various information necessary for the feature amount extraction device 10 to perform processing and the processing result.
  • the storage unit 14 may store, for example, various parameters used when the feature amount extraction unit 13 performs machine learning, or may store the feature amount extracted by the feature amount extraction unit 13. Further, the storage unit 14 may store the input time series data and the created recurrence plot.
  • the storage unit 14 is realized by, for example, a magnetic disk or the like.
  • the input unit 11, the recurrence plot creation unit 12, and the feature amount extraction unit 13 are a computer processor (for example, a CPU (Central Processing Unit), a GPU (Graphics Processing Unit)) that operates according to a program (feature amount extraction program). ).
  • a computer processor for example, a CPU (Central Processing Unit), a GPU (Graphics Processing Unit)
  • program feature amount extraction program
  • the program may be stored in the storage unit 14, and the processor may read the program and operate as the input unit 11, the recurrence plot creation unit 12, and the feature amount extraction unit 13 according to the program.
  • the function of the feature amount extraction device 10 may be provided in the SaaS (Software as a Service) format.
  • the feature amount extraction unit 13 since the feature amount extraction unit 13 performs machine learning using the recurrence plot as image data, the feature amount extraction unit 13 can be realized by the GPU to further improve the processing performance. It will be possible.
  • the input unit 11, the recurrence plot creation unit 12, and the feature amount extraction unit 13 may be realized by dedicated hardware, respectively. Further, a part or all of each component of each device may be realized by a general-purpose or dedicated circuit, a processor, or a combination thereof. These may be composed of a single chip or may be composed of a plurality of chips connected via a bus. A part or all of each component of each device may be realized by a combination of the above-mentioned circuit or the like and a program.
  • each component of the feature amount extraction device 10 when a part or all of each component of the feature amount extraction device 10 is realized by a plurality of information processing devices and circuits, the plurality of information processing devices and circuits may be centrally arranged. , May be distributed.
  • the information processing device, the circuit, and the like may be realized as a form in which each of the client-server system, the cloud computing system, and the like is connected via a communication network.
  • the analysis device 20 is a device that outputs the result of analyzing the time series data.
  • the analysis device 20 includes an analysis target input unit 21, a creation unit 22, and a result output unit 23.
  • the analysis target input unit 21 receives the input of the time series data to be analyzed.
  • the analysis target input unit 21 may directly accept the input of the recurrence plot created from the time series data. In this case, the analysis device 20 does not have to include the creation unit 22.
  • the creation unit 22 creates a recurrence plot from the input time series data.
  • the method in which the creation unit 22 creates a recurrence plot is the same as the method in which the recurrence plot creation unit 12 creates a recurrence plot.
  • the result output unit 23 outputs the analysis result of the input time series data using the feature amount extracted by the feature amount extraction unit 13. Specifically, the result output unit 23 outputs an analysis result comparing the feature amount extracted by the feature amount extraction unit 13 with the feature amount indicated by the recurrence plot created from the time series data.
  • the result output unit 23 may output, for example, the contents of time-series data having similar feature amounts, or may output the probabilities of each of the predicted time-series data. Further, when the identification model is generated by the feature amount extraction unit 13, the result output unit 23 may output the identification result by the identification model.
  • the analysis target input unit 21, the creation unit 22, and the result output unit 23 are realized by a computer processor that operates according to a program (analysis program).
  • FIG. 2 is an explanatory diagram showing an operation example of the feature amount extraction device 10 included in the time series data analysis system 100.
  • the input unit 11 accepts the input of time series data.
  • the input unit 11 accepts the input of time series data (step S11).
  • the recurrence plot creation unit 12 creates a recurrence plot from the input time series data (step S12).
  • the feature amount extraction unit 13 extracts the feature amount indicated by the time series data by machine learning using the recurrence plot (step S13).
  • FIG. 3 is an explanatory diagram showing an operation example of the analysis device 20 included in the time series data analysis system 100.
  • the analysis target input unit 21 receives the input of the time series data to be analyzed (step S21).
  • the creation unit 22 creates a recurrence plot from the input time series data (step S22).
  • the result output unit 23 outputs the analysis result of the input time series data using the feature amount extracted by the feature amount extraction unit 13 (step S23).
  • the feature amount extraction unit 13 extracts the feature amount indicated by the time series data by machine learning using the recurrence plot created from the time series data. Therefore, the feature quantity representing the global structure can be extracted from the time series data.
  • the recurrence plot creation unit 12 creates a recurrence plot from the time series data, information indicating the overall structure of the time series data can be visually obtained, so that the feature amount extraction unit 13 makes it possible to extract features from a global perspective.
  • the feature amount can be extracted by using the image recognition technique without going through the work of directly extracting the feature amount from the time series data composed of the time and the value at that time. Furthermore, in the present embodiment, it is possible to capture the characteristics of the time series data that cannot be elucidated by the general recurrence plot quantification method. Therefore, for example, even if the results obtained by a general quantification method are similar and the recurrence plots are similar to the human appearance, it is possible to distinguish them from different time series data. become.
  • time series data analysis system 100 of this embodiment Next, a specific example of the time series data analysis system 100 of this embodiment will be described.
  • the operation of analyzing the type of communication being performed by using the traffic data on the network as time series data will be described.
  • the time-series data analysis system in this specific example can be called a communication type analysis system.
  • the feature amount extraction device 10 extracts the feature amount from the traffic data.
  • the input unit 11 accepts the input of traffic data as learning data.
  • the input unit 11 may accept input of the traffic type and conditions for creating a recurrence plot.
  • the recurrence plot creation unit 12 creates a recurrence plot from the received traffic data.
  • FIG. 4 is an explanatory diagram showing an example of a recurrence plot.
  • the recurrence plot creation unit 12 creates a recurrence plot using the values obtained by converting the input traffic data based on the length and interval of the packets included in the traffic data. Is shown.
  • the left column illustrated in FIG. 4 is a recurrence plot created based on the value obtained by dividing the packet length (Bytes) by the packet interval (ms).
  • the right column illustrated in FIG. 4 is a recurrence plot created based on a value obtained by multiplying the packet length (Bytes) and the packet interval (ms).
  • the feature amount extraction unit 13 extracts the feature amount of the traffic data by performing machine learning using the created recurrence plot as image data.
  • the feature amount extraction unit 13 may generate an identification model for traffic data. Then, the feature amount extraction unit 13 stores the extracted feature amount and the identification model in the storage unit 14.
  • the analysis device 20 analyzes the traffic data.
  • the analysis target input unit 21 receives the input of the traffic data to be analyzed.
  • the creation unit 22 creates a recurrence plot from the input traffic data.
  • the result output unit 23 outputs the analysis result of the input traffic data by using the feature amount extracted by the feature amount extraction unit 13.
  • the result output unit 23 may display, for example, a recurrence plot of time-series data for some or all types illustrated in FIG. 4 and a recurrence plot of traffic data to be analyzed. This allows the analyst to visually confirm the similarity of the time series data.
  • the result output unit 23 may output the probability of the predicted time series data type.
  • FIG. 5 is a block diagram showing an outline of the feature amount extraction device according to the present invention.
  • the feature amount extraction device 80 (for example, the feature amount extraction device 10) according to the present invention is a feature amount extraction unit that extracts the feature amount indicated by the time series data by machine learning using a recurrence plot created from the time series data.
  • 81 (for example, feature amount extraction unit 13) is provided.
  • the feature amount extraction unit 81 extracts the feature amount indicated by the time-series data by machine learning using a plurality of recurrence plots created for the same time-series data for each of a plurality of conditions having different contents. You may. With such a configuration, it is possible to extract features considering a plurality of conditions for the same time series data.
  • the feature quantity extraction unit 81 is a machine using a plurality of recurrence plots created based on conditions in which at least one of the embedding dimension and the delay amount is changed for the same time series data. By learning, the feature quantity indicated by the time series data may be extracted.
  • the feature amount extraction device 80 includes an input unit (for example, input unit 11) that accepts input of time series data and a recurrence plot creation unit (for example, recurrence plot) that creates a recurrence plot from the input time series data. It may be provided with a plot creation unit 12). Then, the feature amount extraction unit 81 may extract the feature amount of the time series data by performing machine learning using the created recurrence plot as image data.
  • an input unit for example, input unit 11
  • a recurrence plot creation unit for example, recurrence plot
  • FIG. 6 is a block diagram showing an outline of the time series data analysis system according to the present invention.
  • the time-series data analysis system (for example, time-series data analysis system 100) according to the present invention includes a feature quantity extraction device 80 illustrated in FIG. 5 and an analysis device 90 (for example, analysis device 20) for analyzing time-series data. I have.
  • the analysis device 90 includes an analysis target input unit 91 (for example, an analysis target input unit 21) that accepts input of time series data to be analyzed, and a creation unit 92 (for example, a creation unit) that creates a recurrence plot from the time series data. 22) and a result output unit 93 (for example, a result output unit 23) that outputs an analysis result of input time series data using the feature amount extracted by the feature amount extraction unit 81.
  • an analysis target input unit 91 for example, an analysis target input unit 21
  • a creation unit 92 for example, a creation unit
  • a result output unit 93 for example, a result output unit 23
  • the feature amount representing the global structure can be extracted from the time series data, so that the accuracy of analyzing the time series data can be improved.
  • the feature amount extraction unit 81 may extract the feature amount indicated by the traffic data by machine learning using the recurrence plot created from the traffic data which is the time series data. Then, the analysis target input unit 91 receives the input of the traffic data to be analyzed, the creation unit 92 creates a recurrence plot from the traffic data, and the result output unit 93 is extracted by the feature amount extraction unit 81. The analysis result of the input traffic data may be output by using the feature amount.
  • FIG. 7 is a schematic block diagram showing a configuration of a computer according to at least one embodiment.
  • the computer 1000 includes a processor 1001, a main storage device 1002, an auxiliary storage device 1003, and an interface 1004.
  • the feature amount extraction device 80 described above is mounted on the computer 1000.
  • the operation of each processing unit described above is stored in the auxiliary storage device 1003 in the form of a program (feature amount extraction program).
  • the processor 1001 reads a program from the auxiliary storage device 1003, deploys it to the main storage device 1002, and executes the above processing according to the program.
  • the auxiliary storage device 1003 is an example of a non-temporary tangible medium.
  • non-temporary tangible media include magnetic disks, magneto-optical disks, CD-ROMs (Compact Disc Read-only memory), DVD-ROMs (Read-only memory), which are connected via interface 1004. Examples include semiconductor memory.
  • the program may be for realizing a part of the above-mentioned functions. Further, the program may be a so-called difference file (difference program) that realizes the above-mentioned function in combination with another program already stored in the auxiliary storage device 1003.
  • difference file difference program
  • a feature amount extraction device provided with a feature amount extraction unit that extracts the feature amount indicated by the time series data by machine learning using a recurrence plot created from the time series data.
  • the feature amount extraction unit obtains the feature amount indicated by the time-series data by machine learning using a plurality of recurrence plots created for each of a plurality of conditions having different contents for the same time-series data.
  • the feature quantity extraction unit is subjected to machine learning using a plurality of recurrence plots created based on conditions in which at least one of the embedding dimension and the delay amount is changed for the same time series data.
  • the feature amount extraction device according to Appendix 1 or Appendix 2 that extracts the feature amount indicated by the time series data.
  • the feature amount extraction device according to any one of Supplementary notes 1 to 4 and an analysis device for analyzing time series data are provided, and the analysis device includes time series data to be analyzed. Outputs the analysis result of the input time series data using the analysis target input unit that accepts input, the creation unit that creates a recurrence plot from the time series data, and the feature quantity extracted by the feature quantity extraction unit.
  • a time-series data analysis system characterized by including a result output unit.
  • the feature amount extraction unit extracts the feature amount indicated by the traffic data by machine learning using the recurrence plot created from the traffic data which is time series data, and the analysis target input unit is the analysis target.
  • the creation unit creates a recurrence plot from the traffic data, and the result output unit uses the feature amount extracted by the feature amount extraction unit to generate the input traffic data.
  • the time-series data analysis system described in Appendix 5 that outputs the analysis results.
  • Appendix 7 A feature amount extraction method characterized in that a computer extracts a feature amount indicated by the time series data by machine learning using a recurrence plot created from the time series data.
  • the feature amount indicated by the time-series data is extracted by machine learning using a plurality of recurrence plots created for the same time-series data for each of a plurality of conditions having different contents. Feature extraction method.
  • a feature amount extraction program for causing a computer to execute a feature amount extraction process for extracting a feature amount indicated by the time series data by machine learning using a recurrence plot created from the time series data.
  • the time-series data is shown by machine learning using a plurality of recurrence plots created for the same time-series data for each of a plurality of conditions having different contents in the feature amount extraction process on a computer.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

特徴量抽出装置80は、時系列データから作成されるリカレンスプロットを用いた機械学習により、その時系列データが示す特徴量を抽出する特徴量抽出部81を備えている。

Description

特徴量抽出装置、時系列データ解析システム、方法およびプログラム
 本発明は、時系列データから特徴量を抽出する特徴量抽出装置、特徴量抽出方法および特徴量抽出プログラム、並びに、抽出された特徴量を用いて時系列データを解析する時系列データ解析システムおよび時系列データ解析方法に関する。
 時系列データは、ある現象の時間的な変化を、連続的、または、所定の間隔で計測して得られる値の系列であり、計測される値そのものや値の変化など、様々な特徴を含むデータである。そのため、任意の2つの時系列データの類似性/異種性の解析や、時系列データからの特徴量抽出を人手で行うことは困難である。そこで、時系列データの全てまたは一部を抜き出して、2つの時系列データの類似性や異種性の解析、特徴量抽出を行う方法が各種提案されている。
 特許文献1には、1次元の時系列信号の特徴を抽出する装置が記載されている。特許文献1に記載された装置は、1次元時系列信号をリカレンスプロット手法に基づいて分析し、それによって生成される2次元画像から高次局所自己相関係数を計算して特徴を抽出する。なお、リカレンスプロットを用いた定量的な時系列データの解析方法は、非特許文献1等に開示されている。
 リカレンスプロットは、統計やカオス理論において用いられる図であり、ある時間において値がほぼ等しくなる時間を点としてプロットした図である。リカレンスプロットは、時系列データの定常性(弱定常性)または非定常性の判別等に用いられる。
 また、特許文献2には、複数の時系列データを用いて、識別対象を所定のクラスに分類するための特徴量を生成する方法が記載されている。また、特許文献2には、データの時間変化を識別する場合、多次元の各次元の入力データに対して統計処理によって算出された2次特徴量を生成し、ニューラルネットワーク又はサポートベクターマシン等の識別器に入力して機械学習を行うことが記載されている。
特開2008-116588号公報 特開2018-005448号公報
平田祥人,"リカレンスプロット:時系列の視覚化を越えて",数理解析研究所講究録,第1768巻,p.150-162,2011年
 特許文献1に記載された高次局所自己相関係数の計算では、1次元時系列信号の分析により生成される2次元画像のヒストグラムから閾値を算出する。そして、得られた閾値をもとに2次元画像情報を2値の情報に変換することで2値画像情報を生成する。しかし、この方法では、次数が2次に限定され、変位方向が3×3領域に限定される。そのため、領域サイズに応じて特徴次元数が指数関数的に増加してしまうという問題がある。
 また、非特許文献1に記載されたリカレンスプロットにより得られる情報は、時系列データの断片的データにすぎないため、時系列データから十分に特徴量を抽出できているとは言い難い。
 一方、特許文献2に記載された方法では、識別対象のデータをパタンデータに変換し、パタンデータを識別器に入力することによって所定の識別を行う。しかし、特許文献2に記載された方法では、時系列データにおける個々の頂点が有する特徴に注目して特徴量が生成されるため、それ以外の情報が特徴量に反映できているとは言い難い。そのため、個々の頂点のみから得られる特徴ではなく、時系列データが示す定常性などを考慮した、大局的な構造を表わす特徴量を生成できることが好ましい
 そこで、本発明は、大局的な構造を表わす特徴量を時系列データから抽出できる特徴量抽出装置、時系列データ解析システム、特徴量抽出方法、時系列データ解析方法および特徴量抽出プログラムを提供することを目的とする。
 本発明による特徴量抽出装置は、時系列データから作成されるリカレンスプロットを用いた機械学習により、その時系列データが示す特徴量を抽出する特徴量抽出部を備えたことを特徴とする。
 本発明による時系列データ解析システムは、上記の特徴量抽出装置と、時系列データを解析する解析装置とを備え、解析装置が、解析対象とする時系列データの入力を受け付ける解析対象入力部と、時系列データからリカレンスプロットを作成する作成部と、特徴量抽出部によって抽出された特徴量を用いて、入力された時系列データの解析結果を出力する結果出力部とを含むことを特徴とする。
 本発明による特徴量抽出方法は、コンピュータが、時系列データから作成されるリカレンスプロットを用いた機械学習により、その時系列データが示す特徴量を抽出することを特徴とする。
 本発明による時系列データ解析方法は、上記の特徴量抽出方法により時系列データが示す特徴量を抽出し、解析対象とする時系列データの入力を受け付け、時系列データからリカレンスプロットを作成し、抽出された特徴量を用いて、入力された時系列データの解析結果を出力することを特徴とする。
 本発明による特徴量抽出プログラムは、コンピュータに、時系列データから作成されるリカレンスプロットを用いた機械学習により、その時系列データが示す特徴量を抽出する特徴量抽出処理を実行させることを特徴とする。
 本発明によれば、大局的な構造を表わす特徴量を時系列データから抽出できる。
本発明による時系列データ解析システムの一実施形態の構成例を示すブロック図である。 特徴量抽出装置の動作例を示すフローチャートである。 解析装置の動作例を示すフローチャートである。 リカレンスプロットの例を示す説明図である。 本発明による特徴量抽出装置の概要を示すブロック図である。 本発明による時系列データ解析システムの概要を示すブロック図である。 少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
 以下、本発明の実施形態を図面を参照して説明する。
実施形態1.
 図1は、本発明による時系列データ解析システムの一実施形態の構成例を示すブロック図である。本実施形態の時系列データ解析システム100は、特徴量抽出装置10と、解析装置20とを備えている。
 特徴量抽出装置10は、時系列データの特徴量を抽出する装置である。本実施形態の特徴量抽出装置10は、入力部11と、リカレンスプロット作成部12と、特徴量抽出部13と、記憶部14とを含む。
 入力部11は、時系列データの入力を受け付ける。受け付ける時系列データの次元は任意であり、2次元であってもよく、3次元以上であってもよい。例えば、時系列データが後述する記憶部14に記憶されている場合、入力部11は、記憶部14に記憶されている時系列データの入力を受け付けてもよい。また、時系列データが外部のストレージ(図示せず)に記憶されている場合、入力部11は、通信回線を通じて外部のストレージから時系列データの入力を受け付けてもよい。
 また、入力部11は、時系列データから作成されたリカレンスプロットの入力を直接受け付けてもよい。この場合、特徴量抽出装置10は、後述するリカレンスプロット作成部12を含んでいなくてもよい。
 リカレンスプロット作成部12は、入力された時系列データからリカレンスプロットを作成する。時系列データからリカレンスプロットを作成する方法は広く知られており、詳細な説明は省略する。なお、リカレンスプロット作成部12は、入力された時系列データに対し、埋め込み次元や遅延量を変化させた複数の条件ごとに、複数のリカレンスプロットを作成してもよい。このように、リカレンスプロット作成部12が、同一の時系列データに対して内容の異なる複数の条件ごとにリカレンスプロットを作成することで、同種の時系列データから複数のリカレンスプロットを作成することが可能になる。
 特徴量抽出部13は、リカレンスプロットを用いた機械学習により、時系列データが示す特徴量を抽出する。具体的には、特徴量抽出部13は、機械学習で画像認識を行う方法と同様の方法で、リカレンスプロットから特徴量を抽出することで、時系列データが示す特徴量を抽出する。
 なお、同一の時系列データに対して内容の異なる複数の条件(具体的には、埋め込み次元や遅延量)ごとに複数のリカレンスプロットが作成されている場合、特徴量抽出部13は、これら複数のリカレンスプロットを用いた機械学習により、時系列データが示す特徴量を抽出してもよい。このような複数のリカレンスプロットを用いて機械学習することで、同種の時系列データから想定される特徴量を抽出することが可能になる。
 また、特徴量抽出部13は、機械学習により、特徴量の抽出だけでなく、リカレンスプロット(より具体的には、時系列データ)を識別するモデルを生成してもよい。なお、特徴量抽出部13が行う機械学習の内容は任意であり、例えば、主成分分析や異種混合学習、ニューラルネットワークなどが挙げられる。
 記憶部14は、特徴量抽出装置10が処理を行うために必要な各種情報や、処理結果を記憶する。記憶部14は、例えば、特徴量抽出部13が機械学習を行う際に用いる各種パラメータを記憶してもよく、特徴量抽出部13によって抽出された特徴量を記憶してもよい。また、記憶部14は、入力された時系列データや、作成されたリカレンスプロットを記憶してもよい。記憶部14は、例えば、磁気ディスク等により実現される。
 入力部11と、リカレンスプロット作成部12と、特徴量抽出部13とは、プログラム(特徴量抽出プログラム)に従って動作するコンピュータのプロセッサ(例えば、CPU(Central Processing Unit )、GPU(Graphics Processing Unit))によって実現される。
 例えば、プログラムは、記憶部14に記憶され、プロセッサは、そのプログラムを読み込み、プログラムに従って、入力部11、リカレンスプロット作成部12および特徴量抽出部13として動作してもよい。また、特徴量抽出装置10の機能がSaaS(Software as a Service )形式で提供されてもよい。
 また、本実施形態では、特徴量抽出部13がリカレンスプロットを画像データとして用いた機械学習を行うため、特徴量抽出部13がGPUにより実現されることで、より処理性能を向上させることが可能になる。
 また、入力部11と、リカレンスプロット作成部12と、特徴量抽出部13とは、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路、プロセッサ等やこれらの組合せによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。
 また、特徴量抽出装置10の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
 解析装置20は、時系列データを解析した結果を出力する装置である。解析装置20は、解析対象入力部21と、作成部22と、結果出力部23とを含む。
 解析対象入力部21は、解析対象とする時系列データの入力を受け付ける。なお、解析対象入力部21は、時系列データから作成されたリカレンスプロットの入力を直接受け付けてもよい。この場合、解析装置20は、作成部22を含んでいなくてもよい。
 作成部22は、入力された時系列データからリカレンスプロットを作成する。なお、作成部22がリカレンスプロットを作成する方法は、リカレンスプロット作成部12がリカレンスプロットを作成する方法と同様である。
 結果出力部23は、特徴量抽出部13によって抽出された特徴量を用いて、入力された時系列データの解析結果を出力する。具体的には、結果出力部23は、特徴量抽出部13によって抽出された特徴量と、時系列データから作成されたリカレンスプロットが示す特徴量とを比較した解析結果を出力する。
 結果出力部23は、例えば、特徴量が類似する時系列データの内容を出力してもよく、予測される時系列データそれぞれの確率を出力してもよい。また、特徴量抽出部13によって識別モデルが生成されている場合、結果出力部23は、その識別モデルによる識別結果を出力してもよい。
 解析対象入力部21と、作成部22と、結果出力部23とは、プログラム(解析プログラム)に従って動作するコンピュータのプロセッサによって実現される。
 次に、本実施形態の時系列データ解析システム100の動作を説明する。図2は、時系列データ解析システム100が備える特徴量抽出装置10の動作例を示す説明図である。ここでは、入力部11は、時系列データの入力を受け付けるものとする。
 入力部11は、時系列データの入力を受け付ける(ステップS11)。リカレンスプロット作成部12は、入力された時系列データからリカレンスプロットを作成する(ステップS12)。そして、特徴量抽出部13は、リカレンスプロットを用いた機械学習により、時系列データが示す特徴量を抽出する(ステップS13)。
 図3は、時系列データ解析システム100が備える解析装置20の動作例を示す説明図である。解析対象入力部21は、解析対象とする時系列データの入力を受け付ける(ステップS21)。作成部22は、入力された時系列データからリカレンスプロットを作成する(ステップS22)。そして、結果出力部23は、特徴量抽出部13によって抽出された特徴量を用いて、入力された時系列データの解析結果を出力する(ステップS23)。
 以上のように、本実施形態では、特徴量抽出部13が、時系列データから作成されるリカレンスプロットを用いた機械学習により、その時系列データが示す特徴量を抽出する。よって、大局的な構造を表わす特徴量を時系列データから抽出できる。
 すなわち、本実施形態では、リカレンスプロット作成部12が時系列データからリカレンスプロットを作成することにより、時系列データの大局的な構造を示す情報を視覚的に得られるため、特徴量抽出部13が、大局的な視点での特徴量を抽出することが可能になる。
 また、本実施形態では、時刻とその時刻での値により構成される時系列データから直接特徴量を抽出するという作業を経ることなく、画像認識の技術を用いて特徴量を抽出できる。さらに、本実施形態では、一般的なリカレンスプロット定量化手法では解明されない時系列データの有する特徴を捉えることができる。そのため、例えば、一般的な定量化手法で得られた結果が同程度であり、かつ、人間の見た目には似通ったリカレンスプロットであっても、それらを異なる時系列データを区別することも可能になる。
 次に、本実施形態の時系列データ解析システム100の具体例を説明する。本具体例では、ネットワーク上のトラフィックデータを時系列データとして用いて、行われている通信の種別を解析する動作を説明する。なお、本具体例における時系列データ解析システムを、通信種別解析システムということができる。
 まず、通信の種別の解析に先立ち、特徴量抽出装置10は、トラフィックデータから特徴量を抽出する。まず、入力部11は、学習データとして、トラフィックデータの入力を受け付ける。入力部11は、トラフィックデータに加え、そのトラフィックの種別や、リカレンスプロットを作成する条件の入力を受け付けてもよい。
 リカレンスプロット作成部12は、受け付けたトラフィックデータからリカレンスプロットを作成する。図4は、リカレンスプロットの例を示す説明図である。図4に示す例では、リカレンスプロット作成部12が、入力されたトラフィックデータを、そのトラフィックデータに含まれるパケットの長さおよび間隔に基づいて変換した値を用いてリカレンスプロットを作成した例を示す。
 具体的には、図4に例示する左欄は、パケット長(Bytes)をパケット間隔(ms)で割った値に基づいて作成されたリカレンスプロットである。一方、図4に例示する右欄は、パケット長(Bytes)とパケット間隔(ms)とを乗じた値に基づいて作成されたリカレンスプロットである。
 特徴量抽出部13は、作成されたリカレンスプロットを画像データとして用いて機械学習を行うことにより、トラフィックデータの特徴量を抽出する。なお、特徴量抽出部13は、トラフィックデータの識別モデルを生成してもよい。そして、特徴量抽出部13は、抽出した特徴量や識別モデルを記憶部14に記憶する。
 次に、解析装置20は、トラフィックデータの解析を行う。まず、解析対象入力部21は、解析対象とするトラフィックデータの入力を受け付ける。次に、作成部22は、入力されたトラフィックデータからリカレンスプロットを作成する。そして、結果出力部23は、特徴量抽出部13によって抽出された特徴量を用いて、入力されたトラフィックデータの解析結果を出力する。
 結果出力部23は、例えば、図4に例示する一部または全部の種別における時系列データのリカレンスプロットと、解析対象のトラフィックデータのリカレンスプロットを合わせて表示してもよい。これにより、解析者が、視覚的に時系列データの類似性を確認できる。他にも、結果出力部23は、予測される時系列データの種別の確率を出力してもよい。
 次に、本発明の概要を説明する。図5は、本発明による特徴量抽出装置の概要を示すブロック図である。本発明による特徴量抽出装置80(例えば、特徴量抽出装置10)は、時系列データから作成されるリカレンスプロットを用いた機械学習により、その時系列データが示す特徴量を抽出する特徴量抽出部81(例えば、特徴量抽出部13)を備えている。
 そのような構成により、大局的な構造を表わす特徴量を時系列データから抽出できる。
 また、特徴量抽出部81は、同一の時系列データに対して内容の異なる複数の条件ごとに作成された複数のリカレンスプロットを用いた機械学習により、その時系列データが示す特徴量を抽出してもよい。そのような構成により、同一の時系列データに対して複数の条件を考慮した特徴量を抽出できる。
 具体的には、特徴量抽出部81は、同一の時系列データに対して埋め込み次元または遅延量の少なくとも一方の条件を変化させた条件に基づいて作成された複数のリカレンスプロットを用いた機械学習により、その時系列データが示す特徴量を抽出してもよい。
 また、特徴量抽出装置80は、時系列データの入力を受け付ける入力部(例えば、入力部11)と、入力された時系列データからリカレンスプロットを作成するリカレンスプロット作成部(例えば、リカレンスプロット作成部12)とを備えていてもよい。そして、特徴量抽出部81は、作成されたリカレンスプロットを画像データとして用いて機械学習を行うことにより、時系列データの特徴量を抽出してもよい。
 図6は、本発明による時系列データ解析システムの概要を示すブロック図である。本発明による時系列データ解析システム(例えば、時系列データ解析システム100)は、図5に例示する特徴量抽出装置80と、時系列データを解析する解析装置90(例えば、解析装置20)とを備えている。
 解析装置90は、解析対象とする時系列データの入力を受け付ける解析対象入力部91(例えば、解析対象入力部21)と、時系列データからリカレンスプロットを作成する作成部92(例えば、作成部22)と、特徴量抽出部81によって抽出された特徴量を用いて、入力された時系列データの解析結果を出力する結果出力部93(例えば、結果出力部23)とを含む。
 そのような構成によっても、大局的な構造を表わす特徴量を時系列データから抽出できるため、時系列データを解析する精度を向上できる。
 また、特徴量抽出部81は、時系列データであるトラフィックデータから作成されるリカレンスプロットを用いた機械学習により、そのトラフィックデータが示す特徴量を抽出してもよい。そして、解析対象入力部91は、解析対象とするトラフィックデータの入力を受け付け、作成部92は、トラフィックデータからリカレンスプロットを作成し、結果出力部93は、特徴量抽出部81によって抽出された特徴量を用いて、入力されたトラフィックデータの解析結果を出力してもよい。
 図7は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。コンピュータ1000は、プロセッサ1001、主記憶装置1002、補助記憶装置1003、インタフェース1004を備える。
 上述の特徴量抽出装置80は、コンピュータ1000に実装される。そして、上述した各処理部の動作は、プログラム(特徴量抽出プログラム)の形式で補助記憶装置1003に記憶されている。プロセッサ1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、当該プログラムに従って上記処理を実行する。
 なお、少なくとも1つの実施形態において、補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD-ROM(Compact Disc Read-only memory )、DVD-ROM(Read-only memory)、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000が当該プログラムを主記憶装置1002に展開し、上記処理を実行してもよい。
 また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であってもよい。
 上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)時系列データから作成されるリカレンスプロットを用いた機械学習により、当該時系列データが示す特徴量を抽出する特徴量抽出部を備えたことを特徴とする特徴量抽出装置。
(付記2)特徴量抽出部は、同一の時系列データに対して内容の異なる複数の条件ごとに作成された複数のリカレンスプロットを用いた機械学習により、当該時系列データが示す特徴量を抽出する付記1記載の特徴量抽出装置。
(付記3)特徴量抽出部は、同一の時系列データに対して埋め込み次元または遅延量の少なくとも一方の条件を変化させた条件に基づいて作成された複数のリカレンスプロットを用いた機械学習により、当該時系列データが示す特徴量を抽出する付記1または付記2記載の特徴量抽出装置。
(付記4)時系列データの入力を受け付ける入力部と、入力された時系列データからリカレンスプロットを作成するリカレンスプロット作成部とを備え、特徴量抽出部は、作成されたリカレンスプロットを画像データとして用いて機械学習を行うことにより、時系列データの特徴量を抽出する付記1から付記3のうちのいずれか1つに記載の特徴量抽出装置。
(付記5)付記1から付記4のうちのいずれか1つに記載の特徴量抽出装置と、時系列データを解析する解析装置とを備え、前記解析装置は、解析対象とする時系列データの入力を受け付ける解析対象入力部と、前記時系列データからリカレンスプロットを作成する作成部と、特徴量抽出部によって抽出された特徴量を用いて、入力された時系列データの解析結果を出力する結果出力部とを含むことを特徴とする時系列データ解析システム。
(付記6)特徴量抽出部は、時系列データであるトラフィックデータから作成されるリカレンスプロットを用いた機械学習により、当該トラフィックデータが示す特徴量を抽出し、解析対象入力部は、解析対象とするトラフィックデータの入力を受け付け、作成部は、前記トラフィックデータからリカレンスプロットを作成し、結果出力部は、前記特徴量抽出部によって抽出された特徴量を用いて、入力されたトラフィックデータの解析結果を出力する付記5記載の時系列データ解析システム。
(付記7)コンピュータが、時系列データから作成されるリカレンスプロットを用いた機械学習により、当該時系列データが示す特徴量を抽出することを特徴とする特徴量抽出方法。
(付記8)同一の時系列データに対して内容の異なる複数の条件ごとに作成された複数のリカレンスプロットを用いた機械学習により、当該時系列データが示す特徴量を抽出する付記7記載の特徴量抽出方法。
(付記9)付記7または付記8に記載の特徴量抽出方法により時系列データが示す特徴量を抽出し、解析対象とする時系列データの入力を受け付け、前記時系列データからリカレンスプロットを作成し、抽出された特徴量を用いて、入力された時系列データの解析結果を出力することを特徴とする時系列データ解析方法。
(付記10)時系列データであるトラフィックデータから作成されるリカレンスプロットを用いた機械学習により、当該トラフィックデータが示す特徴量を抽出し、解析対象とするトラフィックデータの入力を受け付け、前記トラフィックデータからリカレンスプロットを作成し、抽出された特徴量を用いて、入力されたトラフィックデータの解析結果を出力する付記9記載の時系列データ解析方法。
(付記11)コンピュータに、時系列データから作成されるリカレンスプロットを用いた機械学習により、当該時系列データが示す特徴量を抽出する特徴量抽出処理を実行させるための特徴量抽出プログラム。
(付記12)コンピュータに、特徴量抽出処理で、同一の時系列データに対して内容の異なる複数の条件ごとに作成された複数のリカレンスプロットを用いた機械学習により、当該時系列データが示す特徴量を抽出させる付記11記載の特徴量抽出プログラム。
 10 特徴量抽出装置
 11 入力部
 12 リカレンスプロット作成部
 13 特徴量抽出部
 14 記憶部
 20 解析装置
 21 解析対象入力部
 22 作成部
 23 結果出力部

Claims (12)

  1.  時系列データから作成されるリカレンスプロットを用いた機械学習により、当該時系列データが示す特徴量を抽出する特徴量抽出部を備えた
     ことを特徴とする特徴量抽出装置。
  2.  特徴量抽出部は、同一の時系列データに対して内容の異なる複数の条件ごとに作成された複数のリカレンスプロットを用いた機械学習により、当該時系列データが示す特徴量を抽出する
     請求項1記載の特徴量抽出装置。
  3.  特徴量抽出部は、同一の時系列データに対して埋め込み次元または遅延量の少なくとも一方の条件を変化させた条件に基づいて作成された複数のリカレンスプロットを用いた機械学習により、当該時系列データが示す特徴量を抽出する
     請求項1または請求項2記載の特徴量抽出装置。
  4.  時系列データの入力を受け付ける入力部と、
     入力された時系列データからリカレンスプロットを作成するリカレンスプロット作成部とを備え、
     特徴量抽出部は、作成されたリカレンスプロットを画像データとして用いて機械学習を行うことにより、時系列データの特徴量を抽出する
     請求項1から請求項3のうちのいずれか1項に記載の特徴量抽出装置。
  5.  請求項1から請求項4のうちのいずれか1項に記載の特徴量抽出装置と、
     時系列データを解析する解析装置とを備え、
     前記解析装置は、
     解析対象とする時系列データの入力を受け付ける解析対象入力部と、
     前記時系列データからリカレンスプロットを作成する作成部と、
     特徴量抽出部によって抽出された特徴量を用いて、入力された時系列データの解析結果を出力する結果出力部とを含む
     ことを特徴とする時系列データ解析システム。
  6.  特徴量抽出部は、時系列データであるトラフィックデータから作成されるリカレンスプロットを用いた機械学習により、当該トラフィックデータが示す特徴量を抽出し、
     解析対象入力部は、解析対象とするトラフィックデータの入力を受け付け、
     作成部は、前記トラフィックデータからリカレンスプロットを作成し、
     結果出力部は、前記特徴量抽出部によって抽出された特徴量を用いて、入力されたトラフィックデータの解析結果を出力する
     請求項5記載の時系列データ解析システム。
  7.  コンピュータが、時系列データから作成されるリカレンスプロットを用いた機械学習により、当該時系列データが示す特徴量を抽出する
     ことを特徴とする特徴量抽出方法。
  8.  同一の時系列データに対して内容の異なる複数の条件ごとに作成された複数のリカレンスプロットを用いた機械学習により、当該時系列データが示す特徴量を抽出する
     請求項7記載の特徴量抽出方法。
  9.  請求項7または請求項8に記載の特徴量抽出方法により時系列データが示す特徴量を抽出し、
     解析対象とする時系列データの入力を受け付け、
     前記時系列データからリカレンスプロットを作成し、
     抽出された特徴量を用いて、入力された時系列データの解析結果を出力する
     ことを特徴とする時系列データ解析方法。
  10.  時系列データであるトラフィックデータから作成されるリカレンスプロットを用いた機械学習により、当該トラフィックデータが示す特徴量を抽出し、
     解析対象とするトラフィックデータの入力を受け付け、
     前記トラフィックデータからリカレンスプロットを作成し、
     抽出された特徴量を用いて、入力されたトラフィックデータの解析結果を出力する
     請求項9記載の時系列データ解析方法。
  11.  コンピュータに、
     時系列データから作成されるリカレンスプロットを用いた機械学習により、当該時系列データが示す特徴量を抽出する特徴量抽出処理を実行させる
     ための特徴量抽出プログラム。
  12.  コンピュータに、
     特徴量抽出処理で、同一の時系列データに対して内容の異なる複数の条件ごとに作成された複数のリカレンスプロットを用いた機械学習により、当該時系列データが示す特徴量を抽出させる
     請求項11記載の特徴量抽出プログラム。
PCT/JP2019/035254 2019-09-06 2019-09-06 特徴量抽出装置、時系列データ解析システム、方法およびプログラム WO2021044626A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2021543925A JPWO2021044626A1 (ja) 2019-09-06 2019-09-06
PCT/JP2019/035254 WO2021044626A1 (ja) 2019-09-06 2019-09-06 特徴量抽出装置、時系列データ解析システム、方法およびプログラム
US17/640,136 US20220300833A1 (en) 2019-09-06 2019-09-06 Feature extraction device, time-series data analysis system, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/035254 WO2021044626A1 (ja) 2019-09-06 2019-09-06 特徴量抽出装置、時系列データ解析システム、方法およびプログラム

Publications (1)

Publication Number Publication Date
WO2021044626A1 true WO2021044626A1 (ja) 2021-03-11

Family

ID=74853122

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/035254 WO2021044626A1 (ja) 2019-09-06 2019-09-06 特徴量抽出装置、時系列データ解析システム、方法およびプログラム

Country Status (3)

Country Link
US (1) US20220300833A1 (ja)
JP (1) JPWO2021044626A1 (ja)
WO (1) WO2021044626A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019087106A (ja) * 2017-11-08 2019-06-06 Kddi株式会社 学習用データの生成装置、判定装置及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6790159B2 (ja) * 2019-03-19 2020-11-25 ヤフー株式会社 算出装置、算出方法および算出プログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019087106A (ja) * 2017-11-08 2019-06-06 Kddi株式会社 学習用データの生成装置、判定装置及びプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MASUGI, MASAO: "Signal analysis. 1st ed.", 2013, MORIKITA PUBLISHING, Tokyo, ISBN: 978-4-627-78631-8, pages: 108 - 110 *
OGOSHI, KAZUTO ET AL.: "Detection of abnormal heart rate data using CNN", PROCEEDINGS OF THE 2018 IEICE ENGINEERING SCIENCES SOCIETY CONFERENCE/NOLTA, 6 March 2018 (2018-03-06), pages 248, ISSN: 1349-1369 *

Also Published As

Publication number Publication date
US20220300833A1 (en) 2022-09-22
JPWO2021044626A1 (ja) 2021-03-11

Similar Documents

Publication Publication Date Title
KR102021057B1 (ko) 문서 내 문단 추출 장치 및 방법
US20190180142A1 (en) Apparatus and method for extracting sound source from multi-channel audio signal
KR101432429B1 (ko) 시각적 데이터 생성을 이용한 악성 코드 분석 시스템과 그 방법
JP2004139222A (ja) 文書自動分類システム、不要語判定方法、文書自動分類方法、およびプログラム
JP6282045B2 (ja) 情報処理装置および方法、プログラム、記憶媒体
CN109829371B (zh) 一种人脸检测方法及装置
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
CN113892136A (zh) 信号提取系统、信号提取学习方法以及信号提取学习程序
CN113543117B (zh) 携号转网用户的预测方法、装置及计算设备
Qiu et al. A new approach to multimedia files carving
CN114553591A (zh) 随机森林模型的训练方法、异常流量检测方法及装置
EP3588352B1 (en) Byte n-gram embedding model
WO2021044626A1 (ja) 特徴量抽出装置、時系列データ解析システム、方法およびプログラム
CN111797395B (zh) 恶意代码可视化及变种检测方法、装置、设备及存储介质
JP6822484B2 (ja) 情報処理装置、情報処理方法及びプログラム
KR20210132853A (ko) 확률적 경사 하강법을 이용한 변수 선택 장치 및 방법
CN112257757A (zh) 一种基于深度学习的恶意样本检测方法及系统
CN115935208A (zh) 一种数据中心设备多元时间序列运行数据在线分割方法、设备及介质
KR102499861B1 (ko) 인공지능 기반 객체 재인식 장치
CN115343676A (zh) 密封电子设备内部多余物定位技术的特征优化方法
JP7298229B2 (ja) ログ分析装置、ログ分析方法及びコンピュータプログラム
Makandar et al. An approach to analysis of malware using supervised learning classification
CN110990349A (zh) 一种智能系统安全体系中的不平衡日志过采样方法
US20230401263A1 (en) Secret grouping apparatus, secret grouping system, secret grouping method, and program
Bull et al. Delineation of rock fragments by classification of image patches using compressed random features

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19944463

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021543925

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19944463

Country of ref document: EP

Kind code of ref document: A1