WO2009107313A1 - 確率モデル選択装置、確率モデル選択方法、およびプログラム - Google Patents

確率モデル選択装置、確率モデル選択方法、およびプログラム Download PDF

Info

Publication number
WO2009107313A1
WO2009107313A1 PCT/JP2008/073567 JP2008073567W WO2009107313A1 WO 2009107313 A1 WO2009107313 A1 WO 2009107313A1 JP 2008073567 W JP2008073567 W JP 2008073567W WO 2009107313 A1 WO2009107313 A1 WO 2009107313A1
Authority
WO
WIPO (PCT)
Prior art keywords
probability
range
time point
probability model
series data
Prior art date
Application number
PCT/JP2008/073567
Other languages
English (en)
French (fr)
Inventor
健司 山西
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Publication of WO2009107313A1 publication Critical patent/WO2009107313A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Definitions

  • the present invention relates to a probability model selection device that analyzes time series data, a probability model selection method, and a program for causing a computer to execute the method.
  • observation data related to a specific event for example, a command to a server
  • observation data related to a specific event for example, a command to a server
  • Such a technique is disclosed in, for example, Japanese Patent Application Laid-Open No. 2005-141601.
  • Patent Literature 1 includes a prediction distribution storage unit, a prediction distribution update unit, a model sequence storage unit, a model sequence update unit, and an optimum model sequence calculation unit.
  • the predicted distribution updating unit calculates a value indicating the likelihood for the time series data of a plurality of probability models stored in advance in the predicted distribution storage unit.
  • a model history candidate is determined, and the history candidate is stored in the model sequence storage means.
  • Information indicating the history of the selected probability model is selected by the optimum model sequence calculation means by selecting the one having the highest likelihood value from the probability model history candidates stored in the model sequence storage means.
  • the time point at which the probability model changes in the model path output by the optimal model sequence calculation means can be specified as the change point. Therefore, for example, when time-series data indicating the history of a user's command is input, whether or not there has been a change in the user's behavior pattern by checking whether there is a change point in the model path output from the device It becomes possible to know whether or not.
  • the output range of the model path is from the first time point to the last time point in the time series data. For this reason, even if the data constituting the time series data are sequentially input, the model path cannot be output until all the data is input. Therefore, there is a problem that the change points cannot be detected sequentially.
  • An object of the present invention is to provide a probability model selection device, a probability model selection method, and a program that solve the above-described problem that the occurrence of a change point cannot be sequentially detected when data is sequentially input. Is to provide.
  • a probability model selection device is a probability model selection device to which time-series data is input, a storage unit that stores the time-series data, and a calculation that specifies a range for estimating the probability model of the time-series data For each time point within the range specified by the range specification unit and the calculation range specification unit, the probability model of the time series data at the time point is selected from a plurality of probability models, and each of the plurality of probability models Select based on the likelihood for the time series data up to the point in time, determine whether the selected probability models are all the same, and if the selected probability models are not all the same, the selected probability model is the first And a control unit that outputs information indicating a probability model at each time point before the change point, which is the time point when the change occurred.
  • the probability model selection method is a probability model selection method performed by a probability model selection device to which time series data is input, and specifies a range for estimating a probability model of the time series data, and the calculation For each time point within the range specified by the range specifying unit, the time series data probability model of the time series data at the time point is selected from a plurality of probability models to each time point of the plurality of probability models. If the selected probability models are not all the same, the change that is the time when the selected probability model first changed is selected based on the likelihood for Information indicating the probability model at each time point before the point is output.
  • the program according to the present invention is a computer to which time-series data is input, A process for designating a range for estimating a probability model of the time series data, and for each time point within the range designated by the calculation range designation unit, a probability model of the time series data at the time point is a plurality of probability models. A process for selecting based on the likelihood of each of the plurality of probability models for time series data up to that point, a process for determining whether or not the selected probability models are all the same, and the selected When the probability models are not all the same, a process of outputting information indicating the probability model at each time point before the change point, which is the time point when the selected probability model is changed first, is executed.
  • a change point is generated when data constituting the time series data is sequentially input. Can be detected sequentially.
  • FIG. 1 is a block diagram showing a configuration of a probability model selection device according to an embodiment of the present invention.
  • the probability model selection device 1 includes a calculation range designation unit 2, a control unit 3, and a storage unit 4.
  • Calculation range specification unit 2 specifies a range for obtaining a model path from time series data. Note that the first range is determined in advance.
  • the control unit 3 selects a probability model of time-series data at each point in time within the range specified by the calculation range specifying unit 2 from a plurality of predetermined probability models.
  • the probability model of time series data at a time point is a probability model representing time series data before that time point.
  • control unit 3 selects from the plurality of probability models based on the likelihood of each of the plurality of probability models with respect to time series data up to that time point.
  • the control unit 3 specifies the time point when the probability model first changes as a change point, and outputs information indicating the probability model at each time point before the change point as a model path. To do. Then, the control unit 3 notifies the calculation range specifying unit 2 of the change point.
  • control unit 3 includes a plurality of calculation units 31, a selection unit 32, and a change point detection unit 33, and each unit performs the following processing.
  • each calculation unit 31 calculates an estimated value indicating the likelihood of the time series data up to that point of the probability model assigned in advance among the plurality of probability models. calculate.
  • the selection unit 32 selects a probability model with the highest likelihood calculated by each calculation unit 31 from among a plurality of probability models. Select as a probabilistic model for time series data.
  • the change point detection unit 33 determines whether or not the probability models selected by the selection unit 32 for each time point within the range specified by the calculation range specification unit 2 are the same. When the probability models are not all the same, the change point detection unit 33 obtains a change point, notifies the calculation range specifying unit 2 of the change point, and a model path indicating the probability model at each time point before the change point Is output.
  • the storage unit 4 stores time series data, values calculated by the calculation unit 31, and the like.
  • FIG. 2 is a flowchart for explaining an operation example of the probability model selection device of the present embodiment.
  • time-series data is input to the storage unit 4 from a data input device provided outside the probability model selection device 1, and the time-series data is stored in the storage unit 4 (step S1).
  • the calculation range specifying unit 2 monitors the storage unit 4 and determines whether data from the first data to the specified range T has been saved in the storage unit 4.
  • the calculation range specifying unit 2 reads out the time series data up to the specified range T from the storage unit 4 as a data string, and the data string is read from each calculation unit. 31 and the selection unit 32 (step S2).
  • each calculation unit 31 receives the data string from the calculation range specification unit 2, it calculates an estimated value for the data string (step S3).
  • step S3 The operation of step S3 will be described in detail.
  • probability model used in the present invention will be described.
  • probability models all of which are parametric (a type of probability distribution is known).
  • k represents an index of complexity of the probability model.
  • k is the number of parameters in the probability distribution.
  • X represents a random variable.
  • ⁇ i represents a real value parameter of the i-th probability distribution.
  • ⁇ k ( ⁇ 1 ,..., ⁇ k , ⁇ 1,..., ⁇ k ) represents a parameter of the probability model. Then, the probability model is expressed by Equation 1.
  • the selection unit 32 uses the received estimated value of the parameter and the data string received from the calculation range specification unit 2 to calculate an optimal probability model in the specified range T. It selects and outputs to the change point detection part 33 (step S4).
  • step S4 the operation of step S4 will be described in detail.
  • the selection unit 32 uses the following formula 2 as a model path selection criterion.
  • Equation 2 P (k t
  • the selection unit 32 uses a model path (k 1 ,..., K T ) that minimizes the calculation result of Formula 2 as an optimal model path based on an MDL (Minimum Description Length) criterion. To 33. As a result, the operation in step S4 ends.
  • the MDL standard is one of methods for determining an optimal probability model for an event based on time series data. According to the MDL standard, complicated probability models that are excessively matched with time-series data and probability models that are too simple to explain time-series data are excluded, and a relatively simple probability model that matches time-series data is selected.
  • the change point detection unit 33 determines whether or not there is a change point in the received model path (step S5).
  • step S5 When it is determined in step S5 that there is a change point in the model path, the change point detection unit 33 notifies the calculation range specification unit 2 that the change point has been detected together with the time t * when the change point occurs (step S6). ). Then, the change point detection unit 33 outputs the model path before the change point (step S7).
  • step S6 when there are a plurality of change points in the model path, the change point detection unit 33 notifies the calculation range specifying unit 2 of the time when the probability model first changes in the model path as a true change point. To do.
  • the model path is provided to a device (for example, a computer) provided outside the probabilistic model selection device 1.
  • step S5 When it is determined in step S5 that there is no change point in the model path, the change point detection unit 33 notifies the calculation range specifying unit 2 that there is no change point in the model path (step S9). Then, the calculation range specifying unit 2 expands the specified range by one from T to T + 1 in the time series data (step S10). That is, the calculation range specifying unit 2 adds the time immediately after the specified range T to the specified range T, and increases the data constituting the data string by one.
  • step S8 or S10 the process returns to step S2.
  • the designated range is expanded one by one in the order of T + 2, T + 3,.
  • the calculation range specifying unit 2 specifies a range in which a probability model of time series data is estimated. For each time point within the range specified by the calculation range specifying unit 2, the control unit 3 selects a probability model of time series data at the time point from the plurality of probability models. Select based on the likelihood for the time series data up to. The control unit 3 determines whether or not all the selected probability models are the same. When the probability models are not all the same, the control unit 3 outputs information indicating the probability model at each time point before the change point, which is the time point when the selected probability model changes first.
  • the probability model is selected within the specified range.
  • information indicating the probability model at each time point before the change point is output. Therefore, in order to perform the selection operation of the probabilistic model and the confirmation operation of the presence or absence of the change point within the specified range in the time series data, the generation of the change point is sequentially performed when the data constituting the time series data is sequentially input. It becomes possible to detect.
  • the function of the probability model selection apparatus 1 described above is to record a program for realizing the function in a computer-readable recording medium.
  • the program recorded on the recording medium may be read and executed by a computer.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

 データが順次入力されるときに変化点の発生を逐次的に検出することができないとう問題を解決する確率モデル選択装置を提供する。  計算範囲指定部2は、時系列データの確率モデルを推定する範囲を指定する。制御部3は、計算範囲指定部2で指定された範囲内の時点ごとに、該時点での時系列データの確率モデルを、複数の確率モデルの中から、複数の確率モデルのそれぞれの該時点までの時系列データに対する尤度に基づいて選択する。制御部3は、その選択した確率モデルが全て同じか否かを判定する。確率モデルが全て同じではない場合、制御部3は、その選択した確率モデルが最初に変化した時点である変化点以前の各時点の確率モデルを示す情報を出力する。

Description

確率モデル選択装置、確率モデル選択方法、およびプログラム
 本発明は、時系列データの解析を行う確率モデル選択装置、確率モデル選択方法、およびその方法をコンピュータに実行させるためのプログラムに関する。
 特定の事象(例えば、サーバに対するコマンド)に関する観測データを観測順に配列した時系列データを解析する装置には、入力された時系列データにおいてデータの発生パターンが変化した時点である変化点を特定できる情報を出力するものが提案されている。このような技術は、例えば、特許文献1(特開2005-141601号公報)に開示されている。
 特許文献1に記載の装置は、予測分布記憶手段と、予測分布更新手段と、モデル系列記憶手段と、モデル系列更新手段と、最適モデル系列計算手段とから構成されている。
 特許文献1に記載の装置では、まず、入力された時系列データが、予測分布更新手段およびモデル系列更新手段のそれぞれに格納される。予測分布更新手段は、時系列データを構成する各データがそれぞれ対応する時点(時刻)t(t=1,…,n)ごとに、時系列データの複数の確率モデルに対する尤度を計算する。具体的には、予測分布更新手段は、予測分布記憶手段に予め格納されている複数の確率モデルの時系列データに対する尤度を示す値をそれぞれ計算する。
 モデル系列更新手段は、予測分布更新手段が計算した尤度を示す値と時系列データと用いて、時系列データにおける最初の時点(t=1)から最後の時点(t=n)までの確率モデルの履歴の候補を決め、その履歴の候補をモデル系列記憶手段に格納する。最適モデル系列計算手段が、モデル系列記憶手段に格納された確率モデルの履歴の候補の中から尤度を示す値が最も高くなるものを選択し、その選択した確率モデルの履歴を示す情報であるモデルパスを出力する。
 特許文献1に記載の装置によれば、最適モデル系列計算手段が出力したモデルパスにおいて確率モデルが変化した時点を変化点と特定できる。そのため、例えば、あるユーザのコマンドの履歴を示す時系列データが入力される場合、装置から出力されたモデルパスに変化点が存在するか否か調べることで、ユーザの行動パターンに変化が生じたか否か知ることが可能となる。
特開2005-141601号公報
 特許文献1に記載の装置では、モデルパスの出力範囲が、時系列データにおける最初の時点から最後の時点までとなっている。このため、時系列データを構成するデータが順次入力されても、データが全て入力されるまではモデルパスを出力することができない。従って、変化点を逐次的に検出することができないという問題がある。
 本発明の目的は、上記の課題である、データが順次入力されるときに変化点の発生を逐次的に検出することができないという問題を解決する確率モデル選択装置、確率モデル選択方法およびプログラムを提供することである。
 本発明による確率モデル選択装置は、時系列データが入力される確率モデル選択装置であって、前記時系列データを格納する記憶部と、前記時系列データの確率モデルを推定する範囲を指定する計算範囲指定部と、前記計算範囲指定部で指定された範囲内の時点ごとに、該時点での前記時系列データの確率モデルを、複数の確率モデルの中から、前記複数の確率モデルのそれぞれの該時点までの時系列データに対する尤度に基づいて選択し、該選択した確率モデルが全て同じか否かを判定し、前記選択した確率モデルが全て同じではない場合、前記選択した確率モデルが最初に変化した時点である変化点以前の各時点の確率モデルを示す情報を出力する制御部と、を有する。
 また、本発明による確率モデル選択方法は、時系列データが入力される確率モデル選択装置で行われる確率モデル選択方法であって、前記時系列データの確率モデルを推定する範囲を指定し、前記計算範囲指定部で指定された範囲内の時点ごとに、該時点での前記時系列データの確率モデルを、複数の確率モデルの中から、前記複数の確率モデルのそれぞれの該時点までの時系列データに対する尤度に基づいて選択し、前記選択した確率モデルが全て同じか否かを判定し、前記選択した確率モデルが全て同じではない場合、前記選択した確率モデルが最初に変化した時点である変化点以前の各時点の確率モデルを示す情報を出力する。
 また、本発明によるプログラムは、時系列データが入力されるコンピュータに、
 前記時系列データの確率モデルを推定する範囲を指定する処理と、前記計算範囲指定部で指定された範囲内の時点ごとに、該時点での前記時系列データの確率モデルを、複数の確率モデルの中から、前記複数の確率モデルのそれぞれの該時点までの時系列データに対する尤度に基づいて選択する処理と、前記選択した確率モデルが全て同じか否かを判定する処理と、前記選択した確率モデルが全て同じではない場合、前記選択した確率モデルが最初に変化した時点である変化点以前の各時点の確率モデルを示す情報を出力する処理と、を実行させる。
 本発明によれば、時系列データにおける指定された範囲で確率モデルの選択動作および変化点の有無の確認動作を行うため、時系列データを構成するデータが順次入力されるときに変化点の発生を逐次的に検出することが可能となる。
本発明の一実施形態の確率モデル選択装置の構成を示したブロック図である。 確率モデル選択装置の動作例を説明するためのフローチャートである。
 本実施形態の確率モデル選択装置について、図面を参照しながら説明する。
 図1は、本発明の一実施形態の確率モデル選択装置の構成を示したブロック図である。
 図1に示すように、確率モデル選択装置1は、計算範囲指定部2と、制御部3と、記憶部4とを有する。
 計算範囲指定部2は、時系列データからモデルパスを求める範囲を指定する。なお、最初の範囲は、予め定められているものとする。
 制御部3は、予め定められた複数の確率モデルから、計算範囲指定部2が指定した範囲内の時点ごとに、その時点での時系列データの確率モデルを選択する。なお、時点での時系列データの確率モデルは、その時点以前の時系列データを表わす確率モデルである。
 具体的には、制御部3は、その時点ごとに、その複数の確率モデルの中から、その複数の確率モデルのそれぞれの該時点までの時系列データに対する尤度に基づいて選択する。
 その選択した確率モデルが全て同じではない場合、制御部3は、確率モデルが最初に変化した時点を変化点として特定し、その変化点以前の各時点の確率モデルを示す情報をモデルパスとして出力する。そして、制御部3は、その変化点を計算範囲指定部2に通知する。
 一方、その選択した確率モデルが全て同じ場合、変化点がない旨を計算範囲指定部2に通知する。
 制御部3は、より具体的には、複数の計算部31と、選択部32と、変化点検出部33とを有し、各部が以下の処理を行う。
 各計算部31は、計算範囲指定部2で指定された範囲内の時点ごとに、複数の確率モデルのうち予め割り当てられた確率モデルの該時点までの時系列データに対する尤度を示す推定値を計算する。
 選択部32は、計算範囲指定部2で指定された範囲内の時点ごとに、複数の確率モデルの中から、各計算部31で計算された尤度が最も高い確率モデルを、その時点での時系列データの確率モデルとして選択する。
 変化点検出部33は、選択部32が計算範囲指定部2で指定された範囲内の時点ごと選択した確率モデルが全て同じか否かを判定する。その確率モデルが全て同じではない場合、変化点検出部33は、変化点を求め、その変化点を計算範囲指定部2へ通知するとともに、変化点以前の各時点での確率モデルを示すモデルパスを出力する。
 記憶部4は、時系列データや、計算部31が計算した値などを格納する。
 次に、本実施形態の確率モデル選択装置の動作について説明する。
 図2は、本実施形態の確率モデル選択装置の動作例を説明するためのフローチャートである。
 まず、確率モデル選択装置1の外部に設けられたデータ入力装置から、時系列データが記憶部4に入力され、その時系列データが記憶部4に記憶される(ステップS1)。計算範囲指定部2は、記憶部4を監視して、最初のデータから指定範囲Tまでのデータが記憶部4に保存されたか否かを判断する。指定範囲Tまでのデータが記憶部4に保存されると、計算範囲指定部2は、その指定範囲Tまでの時系列データを、データ列として記憶部4から読み出し、そのデータ列を各計算部31および選択部32のそれぞれに出力する(ステップS2)。
 続いて、各計算部31は、計算範囲指定部2からデータ列を受けると、そのデータ列に対する推定値を計算する(ステップS3)。
 ステップS3の動作について、詳しく説明する。
 まず、本発明で用いる確率モデルについて説明する。確率モデルは、複数あり、その全てがパラメトリック(確率分布の型が既知)な確率モデルである。
 なお、本実施形態では、kは、確率モデルの複雑さの指標を示す。kは、例えば確率分布におけるパラメータの数である。Xは、確率変数を示す。P(X)(i=1,…,k)は、それぞれ異なる確率分布を示す。α(i=1,…,k)は、Σi=1 α=1となる正の数を示す。ξは、i番目の確率分布の実数値パラメータを示す。θ=(α,…,αk,ξ1,…,ξ)は、確率モデルのパラメータを示す。すると、確率モデルは、数1で示される。
Figure JPOXMLDOC01-appb-M000001
 次に、ステップS3における計算部31の動作について説明する。
 計算部31は、計算範囲指定部2から指定範囲Tのデータ列Xを受け取ると、データ列Xの各時点t(t=1,…,T)において、時点1から時点t-1までのデータ列Xt-1=x,…,xt-1の各々に対して、予め割り当てられた確率モデルについてパラメータθの推定値θ (t-1)(尤度)を、数1より逐次的に計算する。そして、計算部31のそれぞれは、計算したパラメータの推定値を選択部32に出力するとともに、記憶部4へ格納する。これによりステップS3の動作が終了する。
 選択部32は、計算部31のそれぞれからパラメータの推定値を受け取ると、受け取ったパラメータの推定値と計算範囲指定部2から受け取ったデータ列とを用いて、指定範囲Tにおける最適な確率モデルを選択して変化点検出部33へ出力する(ステップS4)。ここで、ステップS4の動作について、詳しく説明する。
 選択部32は、下記の数2をモデルパスの選択基準として用いる。
Figure JPOXMLDOC01-appb-M000002
 数2において、P(kt|kt-1:β)は、βを実数値パラメータとして時点t-1から時点tへの確率モデルの遷移確率を示す。また、logの底は全て2である。本実施形態では、選択部32は、MDL(Minimum Description Length)基準に基づき、数2の計算結果が最小となるモデルパス(k1,…,kT)を最適なモデルパスとして変化点検出部33へ出力する。これによりステップS4の動作が終了する。
 なお、MDL基準とは、時系列データをもとに、事象に対して最適な確率モデルを決める方法の一つである。MDL基準によれば、時系列データに過度に合致した複雑な確率モデルや、単純すぎて時系列データを説明できない確率モデルは排除され、比較的単純で時系列データに適合した確率モデルが選択される。
 変化点検出部33は、選択部32からモデルパスを受け取ると、受け取ったモデルパスに変化点があるか否か判定する(ステップS5)。
 ステップS5でモデルパスに変化点があると判定された場合、変化点検出部33は、変化点が生じた時点tとともに変化点を検出した旨を計算範囲指定部2へ通知する(ステップS6)。そして、変化点検出部33は、変化点以前のモデルパスを出力する(ステップS7)。
 なお、ステップS6の動作において、モデルパスに複数の変化点がある場合、変化点検出部33は、モデルパスにおいて確率モデルが最初に変化した時点を真の変化点として計算範囲指定部2へ通知する。
 また、ステップS7の動作において、モデルパスは、確率モデル選択装置1の外部に設けられた装置(例えば、コンピュータ)に提供される。
 計算範囲指定部2は、時点tとともに変化点を検出した旨の通知を変化点検出部33より受け取ると、指定範囲Tのデータ列を、最初のデータが時点t=tに対応するデータで、最後のデータがtから指定範囲Tの時点に対応するデータとするデータ列に変更する(ステップS8)。そして、ステップS2以降の動作が繰り返される。
 ステップS5でモデルパスに変化点がないと判定された場合、変化点検出部33は、モデルパスに変化点がない旨を計算範囲指定部2へ通知する(ステップS9)。すると、計算範囲指定部2は、時系列データにおいて指定範囲をTからT+1に一つ広げる(ステップS10)。すなわち、計算範囲指定部2は、指定範囲Tに、その指定範囲Tの直後の時点を加えて、データ列を構成するデータを一つ増やす。
 ステップS8またはS10が終了すると、ステップS2に戻る。このとき、モデルパスに変化点がない場合、指定範囲は、T+2、T+3、…の順に一つずつ広がっていく。
 次に効果を説明する。
 本実施形態によれば、計算範囲指定部2は、時系列データの確率モデルを推定する範囲を指定する。制御部3は、計算範囲指定部2で指定された範囲内の時点ごとに、該時点での時系列データの確率モデルを、複数の確率モデルの中から、複数の確率モデルのそれぞれの該時点までの時系列データに対する尤度に基づいて選択する。制御部3は、その選択した確率モデルが全て同じか否かを判定する。確率モデルが全て同じではない場合、制御部3は、その選択した確率モデルが最初に変化した時点である変化点以前の各時点の確率モデルを示す情報を出力する。
 この場合、指定された範囲で確率モデルの選択が行われる。そして、確率モデルに変化点が存在すると、その変化点以前の各時点における確率モデルを示す情報が出力される。したがって、時系列データにおける指定された範囲で確率モデルの選択動作および変化点の有無の確認動作を行うため、時系列データを構成するデータが順次入力されるときに変化点の発生を逐次的に検出することが可能となる。
 また、時系列データにおいて指定範囲ごとに各時点における確率モデル(モデルパス)を求める計算を行うため、時系列データを構成する全てのデータを用いてモデルパスを求める場合に比べ、情報量および計算量を節約できる。これにより、装置の省資源化を図ることが可能となる
 なお、以上説明した確率モデル選択装置1の機能は、その機能を実現するためのプログラムを、コンピュータにて読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませ実行させることで、実現されてもよい。
 以上、実施形態を参照して本願発明を説明したが、本願発明は、上記実施形態に限定されたものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更を行うことができる。
 この出願は、2008年2月28日に出願された日本出願特願2008-47712号公報を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (10)

  1.  時系列データが入力される確率モデル選択装置であって、
     前記時系列データを格納する記憶部と、
     前記時系列データの確率モデルを推定する範囲を指定する計算範囲指定部と、
     前記計算範囲指定部で指定された範囲内の時点ごとに、該時点での前記時系列データの確率モデルを、複数の確率モデルの中から、前記複数の確率モデルのそれぞれの該時点までの時系列データに対する尤度に基づいて選択し、該選択した確率モデルが全て同じか否かを判定し、前記選択した確率モデルが全て同じではない場合、前記選択した確率モデルが最初に変化した時点である変化点以前の各時点の確率モデルを示す情報を出力する制御部と、を有する確率モデル選択装置。
  2.  請求の範囲第1項に記載の確率モデル選択装置において、
     前記制御部は、前記選択した確率モデルが全て同じではない場合、前記変化点を前記計算範囲指定部に通知し、
     前記計算範囲指定部は、前記制御部から前記変化点を受けると、前記範囲を、前記変化点を最初の時点とする範囲に変更する、確率モデル選択装置。
  3.  請求の範囲第1項または請求の範囲第2項に記載の確率モデル選択装置において、
     前記制御部は、前記選択した確率モデルが全て同じ場合、前記変化点がなかった旨を前記計算範囲指定部へ通知し、
     前記計算範囲指定部は、前記制御部から前記変化点がなかった旨を受けると、前記範囲に、該範囲の直後の時点を加える、確率モデル選択装置。
  4.  請求の範囲第1項ないし請求の範囲3項のいずれか1項に記載の確率モデル選択装置において、
     前記制御部は、
     前記計算範囲指定部で指定された範囲内の時点ごとに、前記複数の確率モデルのそれぞれの該時点までの時系列データに対する尤度を計算する計算部と、
     前記計算範囲指定部で指定された範囲内の時点ごとに、前記複数の確率モデルの中から前記計算部が計算した尤度が最も高い確率モデルを、該時点での前記時系列データの確率モデルとして選択する選択部と、
     前記選択部で選択された確率モデルが全て同じか否かを判定し、前記確率モデルが全て同じではない場合、前記変化点以前の各時点での確率モデルを示す情報を出力する変化点検出部と、を有する、確率モデル選択装置。
  5.  時系列データが入力される確率モデル選択装置で行われる確率モデル選択方法であって、
     前記時系列データの確率モデルを推定する範囲を指定し、
     前記計算範囲指定部で指定された範囲内の時点ごとに、該時点での前記時系列データの確率モデルを、複数の確率モデルの中から、前記複数の確率モデルのそれぞれの該時点までの時系列データに対する尤度に基づいて選択し、
     前記選択した確率モデルが全て同じか否かを判定し、
     前記選択した確率モデルが全て同じではない場合、前記選択した確率モデルが最初に変化した時点である変化点以前の各時点の確率モデルを示す情報を出力する、確率モデル選択方法。
  6.  請求の範囲第5項に記載の確率モデル選択方法において、
     前記選択した確率モデルが全て同じではない場合、前記範囲を、前記変化点を最初の時点とする範囲に変更する、確率モデル選択方法。
  7.  請求の範囲第5項または請求の範囲第6項に記載の確率モデル選択方法において、
     前記選択した確率モデルが全て同じ場合、前記範囲に、該範囲の直後の時点を加える、確率モデル選択方法。
  8.  時系列データが入力されるコンピュータに、
     前記時系列データの確率モデルを推定する範囲を指定する処理と、
     前記計算範囲指定部で指定された範囲内の時点ごとに、該時点での前記時系列データの確率モデルを、複数の確率モデルの中から、前記複数の確率モデルのそれぞれの該時点までの時系列データに対する尤度に基づいて選択する処理と、
     前記選択した確率モデルが全て同じか否かを判定する処理と、
     前記選択した確率モデルが全て同じではない場合、前記選択した確率モデルが最初に変化した時点である変化点以前の各時点の確率モデルを示す情報を出力する処理と、を実行させるプログラム。
  9.  請求の範囲第8項に記載のプログラムにおいて、
     前記選択した確率モデルが全て同じではない場合、前記範囲を、前記変化点を最初の時点とする範囲に変更する処理を前記コンピュータに実行させるプログラム。
  10.  請求の範囲第8項または請求の範囲第9項に記載のプログラムにおいて、
     前記選択した確率モデルが全て同じ場合、前記範囲に、該範囲の直後の時点を加える処理を前記コンピュータに実行させるプログラム。
PCT/JP2008/073567 2008-02-28 2008-12-25 確率モデル選択装置、確率モデル選択方法、およびプログラム WO2009107313A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2008-047712 2008-02-28
JP2008047712 2008-02-28

Publications (1)

Publication Number Publication Date
WO2009107313A1 true WO2009107313A1 (ja) 2009-09-03

Family

ID=41015719

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2008/073567 WO2009107313A1 (ja) 2008-02-28 2008-12-25 確率モデル選択装置、確率モデル選択方法、およびプログラム

Country Status (1)

Country Link
WO (1) WO2009107313A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2016151637A1 (ja) * 2015-03-26 2017-12-14 日本電気株式会社 学習モデル生成システム、方法およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005004658A (ja) * 2003-06-13 2005-01-06 Nec Corp 変化点検出装置,変化点検出方法および変化点検出用プログラム
JP2005141601A (ja) * 2003-11-10 2005-06-02 Nec Corp モデル選択計算装置,動的モデル選択装置,動的モデル選択方法およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005004658A (ja) * 2003-06-13 2005-01-06 Nec Corp 変化点検出装置,変化点検出方法および変化点検出用プログラム
JP2005141601A (ja) * 2003-11-10 2005-06-02 Nec Corp モデル選択計算装置,動的モデル選択装置,動的モデル選択方法およびプログラム

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
"Proceedings of the eleventh ACM SIGKDD international conference on Knowledge discovery in data mining, 2005.08", article YAMANISHI, K. ET AL.: "Dynamic syslog mining for network failure monitoring", pages: 499 - 508 *
"Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining, 2004.08", article MORINAGA, S. ET AL.: "Tracking dynamics of topic trends using a finite mixture model", pages: 811 - 816 *
MARUYAMA, Y. ET AL.: "Dynamic model selection with its applications to computer security", INFORMATION THEORY WORKSHOP, 2004. IEEE, October 2004 (2004-10-01), pages 82 - 87 *
YAMANISHI, K. ET AL.: "Data Mining for Security", NEC JOURNAL OF ADVANCED TECHNOLOGY, vol. 2, no. 1, 2005, pages 63 - 69 *
YAMANISHI, K. ET AL.: "Dynamic Model Selection With its Applications to Novelty Detection", TRANSACTIONS ON INFORMATION THEORY, vol. 53, no. 6, June 2007 (2007-06-01), pages 2180 - 2189 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2016151637A1 (ja) * 2015-03-26 2017-12-14 日本電気株式会社 学習モデル生成システム、方法およびプログラム

Similar Documents

Publication Publication Date Title
JP2008003920A (ja) 時系列データの予測・診断装置およびそのプログラム
US9697471B2 (en) Device and method for managing plant model
US20110288835A1 (en) Data processing device, data processing method and program
CN110824587B (zh) 图像预测方法、装置、计算机设备和存储介质
JP5320985B2 (ja) 予測システム、予測方法および予測プログラム
JP4265296B2 (ja) 変化点検出装置,変化点検出方法および変化点検出用プログラム
JP6529096B2 (ja) シミュレートシステム、シミュレート方法およびシミュレート用プログラム
KR20190045038A (ko) 음성 인식 방법 및 장치
JP7283485B2 (ja) 推定装置、推定方法、及びプログラム
JP7180692B2 (ja) 推定装置、推定方法、及びプログラム
JP2020086778A (ja) 機械学習モデル構築装置および機械学習モデル構築方法
JP2018528511A (ja) 生産システムにおける出力効率の最適化
WO2014087590A1 (ja) 最適化装置、最適化方法および最適化プログラム
KR102045415B1 (ko) 자동으로 최적의 통계 모델을 결정하는 방법 및 그 장치
JP2021149842A (ja) 機械学習システム及び機械学習方法
TWI677799B (zh) 模型構築系統及模型構築方法
WO2020218246A1 (ja) 最適化装置、最適化方法、及びプログラム
JP7047283B2 (ja) 情報処理装置、方法、及びプログラム
JP2020038485A (ja) 学習装置、判定装置、学習方法、判定方法、学習プログラムおよび判定プログラム
CN116388864B (zh) 量子网络设备性能预测方法、装置、电子设备及存储介质
WO2009107313A1 (ja) 確率モデル選択装置、確率モデル選択方法、およびプログラム
JP2008234094A (ja) 予測モデル選択方法、予測方法、およびパラメータ推定装置、ならびにそのプログラム
US20210232941A1 (en) Method, system, and computer program product for determining causality
JP2024017791A (ja) ニューラルネットワークの学習方法、特徴選択装置、特徴選択方法、及びコンピュータプログラム
JP2024003643A (ja) ニューラルネットワークの学習方法、コンピュータプログラム、及び余寿命予測システム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08872751

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 08872751

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP