JP5077711B2 - Time series analysis apparatus, time series analysis method, and program - Google Patents
Time series analysis apparatus, time series analysis method, and program Download PDFInfo
- Publication number
- JP5077711B2 JP5077711B2 JP2009231488A JP2009231488A JP5077711B2 JP 5077711 B2 JP5077711 B2 JP 5077711B2 JP 2009231488 A JP2009231488 A JP 2009231488A JP 2009231488 A JP2009231488 A JP 2009231488A JP 5077711 B2 JP5077711 B2 JP 5077711B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- parameter
- trend
- function
- time series
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、時系列データの推移を推測する技術に関する。 The present invention relates to a technique for estimating transition of time series data.
非特許文献1に示すように、ブログや掲示板上のクチコミ情報をリアルタイムに収集、分析するASP型サービスが各社から提供されている。但し、これらのサービスでは、将来のブログの書き込み数がどのように推移していくかは予測されない。
As shown in Non-Patent
ここで、経済や交通など、他の分野であれば、株価や交通情報の推移を予測する技術が用いられている。 Here, in other fields such as economy and traffic, a technology for predicting the transition of stock prices and traffic information is used.
例えば、特許文献1に記載された学習装置は、ブログの書き込み数を予測するものでないが、交通情報に関する時系列データを取得し、AR(Auto Regression)モデルのクラスを使用して、周期的なパターンを付加した、将来の予測値を算出することができる。
For example, the learning device described in
しかし、特許文献1に記載された学習装置では、ブログの書き込み数など、Web関係のデータの推移を正確に予測できない場合があった。
However, the learning device described in
Web関係のデータの変動には、周期性のほか、特有の傾向も存在する。これに対し、特許文献1の学習装置は、周期的な変動を考慮して、予測値を算出するが、データが上昇傾向、下降傾向にあるといった特有の傾向については考慮していない。
In addition to periodicity, there is a unique tendency in fluctuations in Web-related data. On the other hand, the learning device of
このため、特許文献1に記載された技術をWeb関係のデータに適用すると、予測値と実際の値との間のずれが大きくなってしまうという問題があった。
For this reason, when the technique described in
本発明は、Web関係のデータの予測値を正確に求めることを目的とする。 An object of the present invention is to accurately obtain a predicted value of Web-related data.
上記目的を達成するために、本発明の時系列分析装置は、Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手段と、Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手段と、前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手段と、を有し、
前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正する補正手段を有し、
前記トレンドパラメータ算出手段は、前記補正手段により外れ値が検出された場合、該補正手段により該外れ値が補正された前記時系列値から前記トレンドパラメータを算出し、
前記補正手段は、前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をy t 、自然数をm、該バースト期間におけるバースト値をBURSTとして、後述する式1ないし式3により各バースト期間のバースト値を算出し、該バースト値の絶対値が高い順に所定個のバースト期間を抽出し、抽出した該バースト期間内の時系列値を外れ値として補正する。
In order to achieve the above-mentioned object, the time series analysis apparatus of the present invention represents an increase / decrease tendency peculiar to Web-related data, a function whose parameter is undetermined is previously defined as a trend function, and is aggregated for a specific matter. Trend parameter calculation means for calculating the parameter of the trend function as a trend parameter based on the time-series value of the Web-related data, and a periodicity peculiar to the Web-related data, and a function whose parameter is undetermined as a periodic function Based on the time series value that is defined in advance and the trend function to which the trend parameter is applied is removed, a periodic parameter calculation unit that calculates a parameter of the periodic function as a periodic parameter, and a calculation by the trend parameter calculation unit The trend function to which the trend parameter is applied, and the previous A prediction formula calculation means for calculating a prediction formula for predicting a transition of Web-related data related to the specific matter by adding the periodic function to which the periodic parameter calculated by the periodic parameter calculation means is applied; , have a,
Among the time series values, there is a correction unit that detects outliers that are suddenly increased or decreased, and corrects the outliers,
When the outlier is detected by the correcting unit, the trend parameter calculating unit calculates the trend parameter from the time series value in which the outlier is corrected by the correcting unit,
In the plurality of burst periods, each of which is a period when the time series values are aggregated, the correction means includes mintime as the first time in each burst period, and the last time in the burst period. , Maxtime is a positive real number, t is the time when the time series values are tabulated, y t is the time series value at time t , m is the natural number, and BURST is the burst value in the burst period. 3 calculates the burst value of each burst period, extracts a predetermined number of burst periods in descending order of the absolute value of the burst value, and corrects the extracted time-series values within the burst period as outliers.
本発明の時系列分析方法は、Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め保持したトレンドパラメータ算出手段が、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出し、Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め保持した周期パラメータ算出手段が、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出し、予測式算出手段が、前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出し、
前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正し、
前記トレンドパラメータを算出する際に、前記外れ値が検出された場合、該外れ値が補正された前記時系列値から前記トレンドパラメータを算出し、
前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をy t 、自然数をm、該バースト期間におけるバースト値をBURSTとして、後述する式1ないし式3により各バースト期間のバースト値を算出し、該バースト値の絶対値が高い順に所定個のバースト期間を抽出し、抽出した該バースト期間内の時系列値を外れ値として補正する、時系列分析方法である。
The time series analysis method according to the present invention represents a trend of increase or decrease peculiar to Web-related data, and the trend-parameter calculating means that holds in advance a function whose parameter is undetermined as a trend function has collected Web-related data for a specific matter. A periodic parameter calculation means for calculating a parameter of the trend function as a trend parameter based on the time series value of the time series, representing a periodicity peculiar to Web-related data, and holding a function whose parameter is undetermined in advance as a periodic function; Based on the time series value from which the trend function to which the trend parameter has been applied is removed, the parameter of the periodic function is calculated as a periodic parameter, and the prediction formula calculating means calculates the trend parameter calculated by the trend parameter calculating means. Applied trend function and periodic parameter calculation By adding the said periodic function of applying said periodic parameter calculated by the step, calculates a prediction equation for predicting a transition of data in Web relationships for the particular matter,
Detecting outliers that are suddenly increased or decreased among the time series values, correcting the outliers,
When calculating the trend parameter, if the outlier is detected, the trend parameter is calculated from the time series value in which the outlier is corrected,
In a plurality of burst periods, each period of which the time series values are aggregated being the first period, the first period in each burst period is mintime, the last period in the burst period is maxtime, and positive Assuming that the real number is α, the time when the time series values are aggregated is t, the time series value at the time t is y t , the natural number is m, and the burst value in the burst period is BURST, each burst period is expressed by the following
本発明のプログラムは、コンピュータに、Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手順、Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手順、及び前記トレンドパラメータ算出手順で算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手順で算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手順、
前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正する補正手順、
を実行させ、
前記トレンドパラメータ算出手順では、前記補正手順により外れ値が検出された場合、該補正手順により該外れ値が補正された前記時系列値から前記トレンドパラメータを算出し、
前記補正手順では、前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をy t 、自然数をm、該バースト期間におけるバースト値をBURSTとして、後述する式1ないし式3により各バースト期間のバースト値を算出し、該バースト値の絶対値が高い順に所定個のバースト期間を抽出し、抽出した該バースト期間内の時系列値を外れ値として補正するプログラムである。
The program of the present invention shows a time series of Web-related data aggregated with respect to a specific matter, in which a computer shows a tendency to increase or decrease specific to Web-related data, a function whose parameter is undetermined is previously defined as a trend function. A trend parameter calculation procedure for calculating a parameter of the trend function as a trend parameter based on a value, a periodicity peculiar to Web-related data, a function whose parameter is undetermined is previously defined as a periodic function, and the trend parameter Based on the time series value from which the trend function is applied, the periodic parameter calculation procedure for calculating the parameter of the periodic function as a periodic parameter, and the trend parameter calculated in the trend parameter calculation procedure is applied. Trend function and periodic parameter calculation By adding the said periodic function of applying said periodic parameter calculated in step, the prediction equation calculation step of calculating a prediction equation for predicting a transition of data in Web relationships for the particular matter,
A correction procedure for detecting outliers that are suddenly increased or decreased among the time series values and correcting the outliers,
And execute
In the trend parameter calculation procedure, when an outlier is detected by the correction procedure, the trend parameter is calculated from the time series value in which the outlier is corrected by the correction procedure,
In the correction procedure, in a plurality of burst periods in which each period of the period in which the time series values are aggregated is the first period, the first period in each burst period is mintime, and the last period in the burst period , Maxtime is a positive real number, t is the time when the time series values are tabulated, y t is the time series value at time t , m is the natural number, and BURST is the burst value in the burst period. 3 is a program for calculating a burst value of each burst period, extracting a predetermined number of burst periods in descending order of the absolute value of the burst value, and correcting the extracted time series values in the burst period as outliers .
本発明によれば、時系列分析装置は、Web関係のデータに特有の増減傾向や周期性を表す関数のパラメータを算出するので、周期性のほか、増減傾向も存在するブログなどに関する時系列値について、予測値を正確に算出できる。 According to the present invention, the time series analysis apparatus calculates the parameter of the function representing the increase / decrease tendency and periodicity peculiar to the Web-related data. Can accurately calculate the predicted value.
本発明を実施するための形態について図面を参照して詳細に説明する。図1は、本実施形態の時系列データ分析システム1の一構成例を示す全体図である。時系列データ分析システムは、時系列で集計された値(以下、「時系列値」という)を示す時系列データを分析する。本実施形態では、時系列で集計されたブログの書き込み数を時系列値とする。
Embodiments for carrying out the present invention will be described in detail with reference to the drawings. FIG. 1 is an overall view showing a configuration example of a time-series
図1を参照すると、時系列データ分析システム1は、利用者PC10と、分析・可視化サーバ20と、ブログDB30と、予測パラメータDB40とを有する。
Referring to FIG. 1, the time-series
分析・可視化サーバ20は、ブログ抽出・集計部201、トレンド成分学習部202、周期成分学習部203、および分析結果作成部204を有する。
The analysis /
ブログDB30は、ブログデータを収集し、それらのデータをカテゴリに分類して格納する。
The
利用者PC10は、時系列値の分析を要求する時系列分析要求データを受け付ける。時系列分析要求データが入力されると、利用者PC10は、その時系列分析要求データを分析・可視化サーバ20へ送信する。
The
図2は、時系列分析要求データに含まれる情報を示す図である。同図を参照すると、時系列分析要求データは、「カテゴリ」、「キーワード」、「教師データ期間」、および「予測期間」を示す情報を含む。 FIG. 2 is a diagram illustrating information included in the time series analysis request data. Referring to the figure, the time series analysis request data includes information indicating “category”, “keyword”, “teacher data period”, and “prediction period”.
「カテゴリ」は、集計対象のブログの属性である。例えば、飲料、電化製品、携帯電話、ビール、有名人など、キーワードのジャンルが指定される。「キーワード」は、ブログにおいて検索される語句である。「教師データ期間」は、ブログが集計される期間である。「予測期間」は、ブログの書き込み数の予測値が算出される期間である。 “Category” is an attribute of a blog to be counted. For example, keyword genres such as beverages, electrical appliances, mobile phones, beers, and celebrities are designated. A “keyword” is a phrase searched for in a blog. The “teacher data period” is a period during which blogs are tabulated. The “prediction period” is a period during which a predicted value of the number of blog writes is calculated.
図3は、ブログ抽出・集計部201の一構成例を示すブロック図である。同図を参照すると、ブログ抽出・集計部201は、集計部2011、および特異点補正部2012を有する。
FIG. 3 is a block diagram illustrating a configuration example of the blog extraction /
集計部2011は、図2に示した時系列分析要求データから、カテゴリ、キーワード、教師データ期間、および予測範囲を取得する。集計部2011は、教師データ期間における、そのカテゴリに属するブログデータをブログDB30に格納されたブログデータから抽出する。集計部2011は、それらのブログデータから、キーワードを含むブログの書き込みを検索し、教師データ期間内の各日付において、検索されたブログの書き込み数を集計する。
The
特異点補正部2012は、集計結果から外れ値を検出し、補正する。外れ値は、不定期なイベントによる書き込み数の急増やシステム障害による書き込み数の急減・欠損など、時系列値が突発的に増減したときの値である。外れ値は、特異点とも呼ばれる。
The
外れ値の抽出において、特異点補正部2012は、長さが最小値から最大値までの範囲で可変のバースト期間について、その長さを最小値に設定する。本実施形態では、最小値は1日に設定され、利用者は最大値のみを設定する。
In the outlier extraction, the
そして、特異点補正部2012は、バースト期間の初日を教師データ期間の初日とし、下記の式によりバースト値を算出する。以降、特異点補正部2012は、バースト期間の各日付をバースト期間の初日として、各日付に対応するバースト値を算出する。同様の手順で、特異点補正部2012は、最大値に達するまで、バースト期間の長さを可変し、各日付に対応するバースト値を算出する。
Then, the
上記(式3)において、「yi」は、「mintime」から数えて「i」番目の日付において集計されたブログの書き込み数である。「m」は、バースト期間の最大値以上で、教師データ期間の長さ以下の値(例えば、7)である。つまり、「SABUNi」は、「i」番目の日付において集計されたブログの書き込み数「yi」と、「i」番目の日付の「m」日前から「i」番目の日付までの間におけるブログの書き込み数の平均値と、の間の差分である。 In the above (Formula 3), “y i ” is the number of blog writes counted on the “i” -th date counted from “mintime”. “M” is a value (for example, 7) that is not less than the maximum value of the burst period and not more than the length of the teacher data period. In other words, “SABUN i ” is the number of blog writes “y i ” aggregated on the “i” th date, and “m” days before the “i” th date to the “i” th date. This is the difference between the average number of blog entries.
バースト期間の長さ「W」と、「m」の値とは、外れ値が適切に検出されるように調整される。例えば、外れ値を1日単位で検出したい場合は、「W」は0に設定される。また、外れ値が2日以上連続で出現することが多い場合、利用者は「W」を1以上に設定すればよい。「m」は、「W」の大きさに応じて適切な値が設定される。 The length of the burst period “W” and the value of “m” are adjusted so that outliers are properly detected. For example, when it is desired to detect outliers in units of one day, “W” is set to zero. In addition, when outliers often appear continuously for two days or more, the user may set “W” to 1 or more. “M” is set to an appropriate value according to the size of “W”.
あるバースト期間内に外れ値がある場合、そのバースト期間のバースト値の絶対値は、バースト期間内に外れ値のない場合よりも大きくなる。このため、特異点補正部2012は、バースト期間ごとに、バースト値を算出することで、どのバースト期間内に外れ値があるのかを効率的に判断できる。
When there is an outlier within a certain burst period, the absolute value of the burst value during that burst period is larger than when there is no outlier within the burst period. For this reason, the
特異点補正部2012は、バースト値が高い順に各バースト期間をソートする。特異点補正部2012は、バースト値が高い所定個のバースト期間とバースト値の低い所定個のバースト期間とを、特異点を含むバースト期間として抽出する。例えば、上位、下位10個のバースト期間が抽出される。
The
但し、バースト期間の抽出においては、特異点補正部2012は、バースト値の絶対値の高い期間を優先してバースト期間を順に抽出する。そして、既に抽出したバースト期間と日付が重複するバースト期間は、抽出対象から除外する。
However, in the burst period extraction, the
特異点補正部2012は、抽出したバースト期間内の時系列値を外れ値として、それらの外れ値を補正する。例えば、特異点補正部2012は、直近データの平均値で補正する。但し、特異点補正部2012は、外れ値が最後のデータで、直後のデータがない場合、その外れ値を除外し、以下に説明する時系列分析において、その値を用いない。特異点補正部2012は、補正後の集計結果を示す学習データを出力する。
The
図1に戻り、トレンド成分学習部202、周期成分学習部203、および分析結果作成部204について説明する。
Returning to FIG. 1, the trend
トレンド成分学習部202は、特異点補正部2012が出力した学習データから、トレンドパラメータを算出する。
The trend
トレンドパラメータとは、教師データ期間におけるブログ書き込み数の増加傾向、または減少傾向を示す関数(以下、「トレンド関数」という)のパラメータである。例えば、トレンドパラメータとして、トレンド関数の係数や指数が算出される。 The trend parameter is a parameter of a function (hereinafter referred to as “trend function”) indicating an increasing tendency or a decreasing tendency of the number of blog entries during the teacher data period. For example, a trend function coefficient or index is calculated as the trend parameter.
トレンド関数は、例えば、下記の式で表わされる関数である。トレンド関数は、ブログ書き込み数の予測において、増減傾向のみが抽出された成分であるから、トレンド成分とも呼ばれる。 The trend function is a function represented by the following formula, for example. The trend function is also referred to as a trend component because it is a component in which only an increase / decrease tendency is extracted in the prediction of the number of blog entries.
トレンド成分学習部202は、例えば、最小ニ乗法を使用することにより、測定データを上記(式4)に近似し、トレンドパラメータを算出する。
The trend
具体的には、下記の式に、測定値を代入することにより、トレンドパラメータを算出する。 Specifically, the trend parameter is calculated by substituting the measured value into the following equation.
、「β」は、トレンドパラメータである。「y」は、集計されたブログの書き込み数である。
, “Β” is a trend parameter. “Y” is the total number of written blogs.
トレンド成分学習部202は、算出したトレンドパラメータを適用したトレンド関数を導出し、学習データの各日付の書き込み数から、トレンド関数にその日付に対応する日数(「x」)を代入することで得られた書き込み数(「y(x)」)を減算する。
The trend
周期成分学習部203は、トレンド関数の算出値を減算した後の学習データをフーリエ解析することにより、周期パラメータを算出する。
The periodic
周期パラメータとは、教師データ期間におけるブログ書き込み数、すなわち時系列値の周期的な変動を示す関数(以下、「周期関数」という)のパラメータである。例えば、周期パラメータとして、周期関数の係数や指数が算出される。 The periodic parameter is a parameter of a function (hereinafter referred to as “periodic function”) indicating the number of blog writings in the teacher data period, that is, a periodic variation of the time series value. For example, a periodic function coefficient or index is calculated as the periodic parameter.
周期関数は、例えば、下記の式で表わされる関数である。周期関数は、ブログ書き込み数の予測において、周期性のみが抽出された成分であるから、周期成分とも呼ばれる。 The periodic function is a function represented by the following formula, for example. Since the periodic function is a component in which only periodicity is extracted in the prediction of the number of blog writes, it is also called a periodic component.
分析結果作成部204は、トレンド関数と周期関数とを加算して、ブログ書き込み数の推移を予測するための予測式を生成する。
The analysis
また、分析結果作成部204は、その予測式の各パラメータ、すなわちトレンドパラメータおよび周期パラメータを示す予測式データを予測パラメータDB40に格納する。
The analysis
そして、分析結果作成部204は、時系列分析要求データの示す予測期間内の各日付のブログ書き込み数を、予測式を使用して算出する。分析結果作成部204は、予測期間内で算出した値を予測値として、各予測値を示す分析結果データを利用者PC10へ送信する。
Then, the analysis
また、分析結果作成部204は、時系列分析要求データの示すカテゴリ、キーワードが、以前にトレンド成分、周期成分を算出したカテゴリ、キーワードと同じであれば、以前に求めた予測式を用いて予測値を算出する。
In addition, the analysis
図4は、ブログ抽出・集計部201が作成する学習データの示す内容をまとめた表である。同図を参照すると、学習データは、「カテゴリ」、および「キーワード」に対応付けて、複数の「日付」および「書き込み件数」を示すデータを含む。「カテゴリ」は、抽出対象のブログデータが属するカテゴリである。「キーワード」は、ブログデータにおいて検索されたキーワードである。「日付」は、集計期間内の各日付である。「書き込み件数」は、キーワードを含むブログが書き込まれた件数である。
FIG. 4 is a table summarizing the contents indicated by the learning data created by the blog extraction /
例えば、時系列分析要求データの示すカテゴリが「食料品」で、キーワードとして「値上げ」が指定された場合について考える。ブログ抽出・集計部201は、「食料品」のカテゴリに属するブログデータについて、指定されたキーワードを検索する。ブログ抽出・集計部201は、キーワード「値上げ」を含むブログデータを抽出し、教師データ期間内、各日付のデータ数をそれぞれ集計する。
For example, consider a case where the category indicated by the time series analysis request data is “food” and “price increase” is specified as a keyword. The blog extraction /
図5および図6を参照して、学習データから特異点を検出し、補正する方法について説明する。ここでは、バースト期間の長さを1日から7日に可変するものとする。また、上記(式3)における「m」を7に設定する。 A method for detecting and correcting a singular point from learning data will be described with reference to FIGS. Here, it is assumed that the length of the burst period is variable from 1 day to 7 days. Further, “m” in the above (Expression 3) is set to 7.
図5に示すように、ブログ抽出・集計部201は、バースト期間の長さ(バースト範囲)を1から7に可変し、教師データ期間内の各日付をバースト期間の初日としたバースト値を算出する。
As shown in FIG. 5, the blog extraction /
図5を参照すると、例えば、バースト範囲が1日で、「mintime」が2009年8月25日の場合のバースト値は「0」である。バースト範囲が2日で、「mintime」が2009年8月25日の場合、「maxtime」は2009年8月26日となり、バースト値は「22.5」である。 Referring to FIG. 5, for example, when the burst range is 1 day and “mintime” is August 25, 2009, the burst value is “0”. When the burst range is 2 days and “mintime” is August 25, 2009, “maxtime” is August 26, 2009, and the burst value is “22.5”.
ブログ抽出・集計部201は、図6(a)のように、各期間において算出したバースト値について降順でソートする。ブログ抽出・集計部201は、バースト値の上位から順にバースト期間を抽出する。
The blog extraction /
ここで、バースト値が同一の値となる期間が複数あった場合、バースト範囲の長い方が優先して抽出される。なお、バースト値の同じ期間が複数あっても、ブログ抽出・集計部201がいずれも抽出する構成としてもよい。
Here, when there are a plurality of periods in which the burst values are the same, the longer burst range is extracted with priority. Even if there are a plurality of periods with the same burst value, the blog extraction /
図6(a)を参照すると、最もバースト値が高いのは、バースト期間の初日を2009年8月28日、バースト範囲を1日として算出されたバースト値である。2番目にバースト値が高いのは、バースト期間の初日を2009年9月14日、バースト範囲を2日として算出されたバースト値である。3番目にバースト値が高いのは、2009年9月14日に対応するバースト値である。まず、これらの3つの期間が、外れ値を含みうるバースト期間として抽出される。 Referring to FIG. 6A, the highest burst value is a burst value calculated with the first day of the burst period being August 28, 2009 and the burst range being one day. The second highest burst value is a burst value calculated with the first day of the burst period being September 14, 2009 and the burst range being two days. The third highest burst value is the burst value corresponding to September 14, 2009. First, these three periods are extracted as burst periods that can include outliers.
そして、4番目にバースト値が高いのは、バースト期間の初日を2009年8月27日、バースト範囲を2日として算出されたバースト値であった。このバースト期間は、既に抽出されたバースト期間内の日付である8月28日を含む。このため、バースト期間の初日を2009年8月27日、バースト範囲を2日とするバースト期間は、抽出対象から除外される。図6(a)における斜線部分は、抽出対象から除外されたバースト期間である。これらのバースト期間が除外された結果を図6(b)に示す。 The fourth highest burst value was a burst value calculated with the first day of the burst period being August 27, 2009 and the burst range being two days. This burst period includes August 28, the date within the already extracted burst period. For this reason, the burst period in which the first day of the burst period is August 27, 2009 and the burst range is two days is excluded from the extraction target. The shaded portion in FIG. 6A is a burst period excluded from the extraction target. The result of excluding these burst periods is shown in FIG.
図5における、太い実線で囲まれた数字は、抽出されたバースト期間に対応するバースト値である。斜線で囲まれた数字は、この抽出済みのバースト期間と日付が重複するバースト期間に対応するバースト値である。これらの斜線で囲まれた部分に対応するバースト期間は、抽出対象から除外される。 In FIG. 5, the number surrounded by a thick solid line is a burst value corresponding to the extracted burst period. The numbers surrounded by diagonal lines are burst values corresponding to burst periods in which the extracted burst periods and dates overlap. Burst periods corresponding to these hatched parts are excluded from extraction targets.
ブログ抽出・集計部201は、図5、図6(a)の斜線部分に対応するバースト期間を除いた後、上位10個のバースト期間を抽出する。次に、最もバースト値が低いバースト値から順に、同様の方法で下位10個のバースト期間が抽出される。
The blog extraction /
なお、上位、下位に関わらず、最も絶対値の大きなバースト値に対応するバースト期間から順に抽出される構成としてもよい。 In addition, it is good also as a structure extracted sequentially from the burst period corresponding to the burst value with the largest absolute value irrespective of a high-order and a low-order.
このように、日付が重複するバースト期間を抽出しないことにより、ブログ抽出・集計部201は、外れ値を精度よく検出できる。
Thus, the blog extraction /
そして、ブログ抽出・集計部201は、抽出したバースト期間内の値を、その前後の平均値に補正する。
Then, the blog extraction /
図7は、予測式データの示す内容をまとめた図である。同図に示すように、予測式データは、「カテゴリ」、「キーワード」、「教師データ期間」、「トレンドパラメータ」、および「周期パラメータ」を示す情報を含む。 FIG. 7 is a table summarizing the contents of the prediction formula data. As shown in the figure, the prediction formula data includes information indicating “category”, “keyword”, “teacher data period”, “trend parameter”, and “periodic parameter”.
「カテゴリ」は、抽出対象のブログデータが属するカテゴリである。「キーワード」は、ブログデータにおいて検索されたキーワードである。「教師データ期間」は、予測式を算出するために時系列値が集計された期間である。「トレンドパラメータ」は、最小二乗法により算出されたトレンド関数のパラメータである。「周期パラメータ」は、フーリエ解析により算出された周期関数のパラメータである。 “Category” is a category to which the blog data to be extracted belongs. “Keyword” is a keyword searched in the blog data. The “teacher data period” is a period in which time series values are tabulated to calculate a prediction formula. The “trend parameter” is a parameter of a trend function calculated by the least square method. “Periodic parameter” is a parameter of a periodic function calculated by Fourier analysis.
続いて、分析・可視化サーバ20の動作について説明する。図8は、分析・可視化サーバ20の動作を示すフローチャートである。この動作は、分析・可視化サーバ20が時系列分析要求データを受信したときに開始する。
Next, the operation of the analysis /
ブログ抽出・集計部201は、時系列分析要求データに基づいてブログデータを抽出し、集計するブログ抽出・集計処理を実行する(ステップS1)。
The blog extraction /
トレンド成分学習部202は、集計結果を上記(4)式に近似することにより、トレンド成分を抽出する(ステップS2)。周期成分学習部203は、周期成分を抽出するための周期成分抽出処理を実行する(ステップS3)。
The trend
分析結果作成部204は、トレンドパラメータ、周期パラメータを予測パラメータDB40に格納し、トレンド関数および周期関数を加算して予測式を作成する(ステップS4)。分析結果作成部204は、予測式から、指定された予測期間における時系列値の予測値を算出し、分析結果データを利用者PC10へ出力する(ステップS5)。ステップS5の後、分析・可視化サーバ20は動作を終了する。
The analysis
図9は、ブログ抽出・集計処理を示すフローチャートである。同図を参照すると、ブログ抽出・集計部201は、教師データ期間内において、時系列分析要求データで指定されたカテゴリ、キーワードと全部一致または部分一致する単語を含むブログを抽出し、集計する(ステップS11)。
FIG. 9 is a flowchart showing blog extraction / aggregation processing. Referring to the figure, the blog extraction /
ブログ抽出・集計部201は、教師データ期間をバースト期間ごとに分割し、各バースト期間におけるバースト値を算出する。そして、ブログ抽出・集計部201は、バースト値が高い所定個のバースト期間を抽出することにより特異点を検出し、補正する(ステップS12)。ステップS12の後、ブログ抽出・集計部201は、ブログ抽出・集計処理を終了する。
The blog extraction /
図10は、周期成分抽出処理を示すフローチャートである。同図を参照すると、周期成分学習部203は、上記(式8)、(式9)を使用して年単位の周期パラメータAn、Bnを算出する(ステップS31)。そして、周期成分学習部203は、上記(式10)、(式11)を使用して年単位の周期パラメータan、bnを算出する(ステップS32)。ステップS32の後、周期成分学習部203は、周期成分抽出処理を終了する。
FIG. 10 is a flowchart showing the periodic component extraction process. Referring to the figure, the periodic
図11〜図15を参照して、分析・可視化サーバ20の動作結果の一例について説明する。図11は、分析・可視化サーバ20が、時系列分析要求データに基づいて、教師データ期間でブログの書き込み数を集計した結果をプロットした折れ線グラフである。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。
An example of the operation result of the analysis /
分析・可視化サーバ20は、教師データ期間を、複数のバースト期間に分割し、上記(式1)を使用して、各バースト期間におけるバースト値を算出する。同図に示すように、B1において書き込み数が突発的に増加し、B2において書き込み数が突発的に減少しているので、これらのB1,B2を含むバースト期間において、バースト値の絶対値が高くなる。分析・可視化サーバ20は、これらバースト期間内の外れ値を補正する。
The analysis /
図12は特異点を補正した後の集計結果を示す折れ線グラフである。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。同図に示すように、特異点B1,B2は、いずれも補正されている。 FIG. 12 is a line graph showing the counting result after correcting the singular points. In the figure, the horizontal axis represents each counting date within the teacher data period, and the vertical axis represents the number of blog writes counted on the counting date. As shown in the figure, the singular points B1 and B2 are both corrected.
図13は、分析・可視化サーバ20が、集計結果からトレンド成分を求めた結果を示す図である。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。集計結果から、最小二乗法により、同図の一点鎖線で表わされる対数関数が導出される。同図に示すように、ブログの書き込み件数の推移には、時間の経過とともに徐々に増加してゆく傾向、すなわちトレンドがある。
FIG. 13 is a diagram illustrating a result of the trend component being obtained by the analysis /
図14は、分析・可視化サーバ20が集計結果からトレンド成分を除去し、周期成分を求めた結果を示す図である。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。集計結果から、フーリエ解析より、同図のニ点鎖線で表わされる周期関数が導出される。同図に示すように、ブログの書き込み件数は、年単位で周期的に変化し、週単位でも周期的に変化する。
FIG. 14 is a diagram illustrating a result of the trend component obtained by the analysis /
図15は、分析・可視化サーバ20が、予測式を使用して予測値を算出した結果を示す折れ線グラフである。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。同図の実線の部分は、特異点を補正した集計結果であり、同図の二点鎖線の部分は、予測式で算出した予測期間内の予測値をプロットした結果である。同図に示すように、分析・可視化サーバ20は、予測式を使用することにより、今後のブログ書き込み数の推移を予測することができる。
FIG. 15 is a line graph showing the result of the prediction value calculated by the analysis /
分析・可視化サーバ20は、異なる条件で集計された集計結果や、異なる条件で算出された分析結果を、比較のために同時に表示することもできる。
The analysis /
図16は、同じカテゴリにおいて、類似する製品「製品A」、「製品B」をキーワードとして集計された集計結果と算出された分析結果とを示す折れ線グラフである。同図において、実線の部分が、これらのキーワードについての集計結果である。破線の部分が、これらのキーワードについての予測値をプロットしたものである。 FIG. 16 is a line graph showing a totaled result obtained by counting similar products “product A” and “product B” as keywords in the same category and a calculated analysis result. In the figure, the solid line portion is the total result for these keywords. The broken line is a plot of the predicted values for these keywords.
利用者は、各製品に関する書き込み数がどのように推移するかを比較し、どのように商品の販売、宣伝などを実行するかを検討することができる。 The user can compare how the number of writings related to each product changes, and can consider how to execute sales or promotion of the product.
なお、本実施形態では、分析・可視化サーバ20は、ブログの書き込み数を時系列値として収集しているが、時系列で収集された値であれば、他の時系列値を収集し、分析することもできる。例えば、時系列値は、ブログ以外のWeb関係のデータであってもよい。Web関係のデータは、Webページの記事数や、記事が検索された回数、Webサイトへのアクセスログなどである。
In this embodiment, the analysis /
また、時系列値は、株価、為替とすることも可能である。若しくは、分析・可視化サーバ20は、CPU使用率などのシステムログデータなどを時系列値として分析することもできる。
Further, the time series value may be a stock price or an exchange rate. Alternatively, the analysis /
本実施形態では、分析・可視化サーバ20は、1日ごとにブログ書き込み数を集計しているが、集計する時期は、教師データ期間内の時期であれば、1日に限らない。例えば、分析・可視化サーバ20は、1時間ごとにブログ書き込み数を集計してもよい。
In the present embodiment, the analysis /
本実施形態では、分析・可視化サーバ20は、上記(式1)〜(式3)を使用して外れ値を検出しているが、突発的に増減する値を検出できるのであれば、これらの数式以外の式を使用して外れ値を検出してもよい。
In this embodiment, the analysis /
例えば、上記(式3)において、平均値と「yi」との間の差分を「SABUNi」としているが、差分の絶対値を「SABUNi」として算出してもよい。この場合、分析・可視化サーバ20は、バースト値の上位、所定個のバースト期間を抽出する。
For example, in the above (Equation 3), the difference between the average value and “y i ” is “SABUN i ”, but the absolute value of the difference may be calculated as “SABUN i ”. In this case, the analysis /
本実施形態では、分析・可視化サーバ20は、上記(式4)のように、集計結果を対数関数に近似しているが、対数関数以外の関数に近似してもよいのは勿論である。例えば、分析・可視化サーバ20は、下記に示すような式を用いて線形近似を行ってもよい。
In the present embodiment, the analysis /
本実施形態では、分析・可視化サーバ20は、1年を周期とする周期成分と、1週間を周期とする周期成分とを求めているが、これらと異なる周期の周期成分を求めてもよいのは勿論である。例えば、ブログの書き込み数が1時間ごとに集計される場合、分析・可視化サーバ20は、周期を1日とする周期成分を算出することもできるし、周期を1年でなく、2年や3年としてもよい。
In the present embodiment, the analysis /
本実施形態の分析・可視化サーバ20は、トレンド成分の算出において、最小ニ乗法を使用しているが、集計結果を回帰分析できるのであれば、最小二乗法以外の手法により、トレンド成分を算出してもよい。
The analysis /
本実施形態の分析・可視化サーバ20は、フーリエ解析を行うことにより、周期成分を算出しているが、周期的な変動パターンを求めることができるのであれば、フーリエ解析以外の手法により周期成分を算出してよい。例えば、分析・可視化サーバ20は、AR(Autoregressive model)モデルを使用することにより、周期成分を求めることが可能である。
The analysis /
以上説明したように、本実施形態によれば、時系列分析装置は、Web関係のデータに特有の増減傾向や周期性を表す関数のパラメータを算出するので、時系列値に、周期性のほか、増減傾向があっても、予測値を正確に算出できる。 As described above, according to the present embodiment, the time series analysis apparatus calculates the function parameters representing the increase / decrease tendency and the periodicity peculiar to the Web-related data. Even if there is a tendency to increase or decrease, the predicted value can be calculated accurately.
(第2の実施形態)
本発明の第2の実施形態について説明する。本実施形態の時系列分析システムは、イベントの影響度を更に算出できる点で、第1の実施形態の時系列分析システムと異なる。なお、本実施形態の時系列分析システムについて、図1〜図16で説明した構成と同様な構成の詳細な説明を省略し、第1の実施形態と異なる点について詳しく説明する。
(Second Embodiment)
A second embodiment of the present invention will be described. The time series analysis system according to the present embodiment is different from the time series analysis system according to the first embodiment in that an event influence degree can be further calculated. In addition, about the time series analysis system of this embodiment, the detailed description of the structure similar to the structure demonstrated in FIGS. 1-16 is abbreviate | omitted, and a different point from 1st Embodiment is demonstrated in detail.
本実施形態の利用者PC10は、時系列分析要求データの他、イベントの影響度の算出を要求する影響度分析要求データの入力を受け付ける。イベントの影響度とは、イベントを実行後の、実際のブログの書き込み数が予測値に対して増減した度合を示す値である。例えば、分析・可視化サーバ20は、実際の書き込み数を予測値で割った値を影響度とする。
The
具体的には、イベントの開始から一定期間が経過した時点におけるイベントの影響度を求めたいとき、利用者は、イベントの種類、イベントの開始時期、予測期間、および教師データ期間を利用者PC10に入力する。ここで、イベントの開始時期以前の所定期間が教師データ期間として設定される。また、イベントの開始時期以降の所定期間が予測期間として設定される。本実施形態では、教師データ期間の長さは、予測期間の長さ以上に設定されることが望ましい。
Specifically, when the user wants to determine the degree of influence of an event when a certain period has elapsed since the start of the event, the user sets the event type, event start time, prediction period, and teacher data period to the
例えば、イベントの開始から1カ月感が経過し、その1カ月間におけるイベントの影響度を算出したい場合、利用者は、イベント開始以前の1年間を教師データ期間、イベント開始時から1カ月間の期間を予測期間として入力する。 For example, when a sense of one month has passed since the start of the event and it is desired to calculate the degree of influence of the event during that one month, the user can use the one year before the start of the event for the teacher data period and the first month of the event. Enter the period as the forecast period.
利用者PC10は、イベントの種類、イベントの開始時期、予測期間、および教師データ期間を示す情報を含む影響度分析要求データを分析・可視化サーバ20へ出力する。
The
図17は、影響度分析要求データに含まれる情報を示す図である。同図を参照すると、影響度分析要求データには、「カテゴリ」、「キーワード」、「イベント種類」、「教師データ期間」、および「予測期間」を示す情報を含む。 FIG. 17 is a diagram illustrating information included in the impact analysis request data. Referring to the figure, the impact analysis request data includes information indicating “category”, “keyword”, “event type”, “teacher data period”, and “prediction period”.
「カテゴリ」、「キーワード」は、第1の実施形態と同様である。「教師データ期間」は、イベント開始時期以前の所定期間である。「予測期間」は、イベント開始時期以降の所定期間である。 “Category” and “Keyword” are the same as those in the first embodiment. The “teacher data period” is a predetermined period before the event start time. The “prediction period” is a predetermined period after the event start time.
影響度分析要求データが入力されたとき、分析・可視化サーバ20は、第1の実施形態と同様の方法で予測式を求め、その予測式から、予測期間内の各日付の予測値を算出する。
When the impact analysis request data is input, the analysis /
一方、分析・可視化サーバ20は、予測期間内におけるブログデータをブログDB30から読み出し、予測期間における実際のブログ書き込み数を集計して実測値とする。そして、分析・可視化サーバ20は、予測期間内の実測値の合計を、予測期間内の予測値の合計で除算して得た値をイベントの影響度とする。
On the other hand, the analysis /
分析・可視化サーバ20は、予測値、実測値を表示するための分析結果データを利用者PC10へ送信する。また、分析・可視化サーバ20は、イベントの種類、影響度を示す情報を更に含む予測式データを予測パラメータDB40に格納する。
The analysis /
図18は、予測式データの示す内容をまとめた図である。同図に示すように、予測式データは、「カテゴリ」、「キーワード」、「教師データ期間」、「トレンドパラメータ」、および「周期パラメータ」を示す情報に加え、「イベント」および「影響度」を示す情報を含む。 FIG. 18 is a table summarizing the contents indicated by the prediction formula data. As shown in the figure, in addition to information indicating “category”, “keyword”, “teacher data period”, “trend parameter”, and “periodic parameter”, the prediction formula data includes “event” and “influence degree”. Contains information indicating.
「イベント」は、分析対象のイベントの種類である。「影響度」は、実測値と予測値とから得られるイベントの影響度である。 “Event” is the type of event to be analyzed. The “influence degree” is the influence degree of the event obtained from the actual measurement value and the predicted value.
図19は、本実施形態の分析・可視化サーバ20の動作を示すフローチャートである。この動作は、分析・可視化サーバ20が影響度分析要求データを受信したときに開始する。
FIG. 19 is a flowchart showing the operation of the analysis /
分析・可視化サーバ20は、教師データ期間のブログ書き込み数の集計結果から、予測期間における予測値を算出するための時系列分析処理を実行する(ステップT1)。図19における時系列分析処理は、図8に示した時系列分析処理と同様の処理である。
The analysis /
分析・可視化サーバ20は、予測期間内の実測値の合計を、予測期間内の予測値の合計で除算することにより、イベントの影響度を算出する(ステップT2)。
The analysis /
図20を参照して、イベントの影響度の算出結の一例について説明する。同図は、予測値と実測値とを示す折れ線グラフである。同図における実線は、実際に集計されたブログの書き込み数をプロットしたものである。一点鎖線は、予測値をプロットしたものである。「P1」の時期はイベントの開始時期である。斜線部分は、予測値と実測値との間の差分を示す部分である。 With reference to FIG. 20, an example of the calculation result of the event influence level will be described. The figure is a line graph showing predicted values and actual measured values. The solid line in the figure is a plot of the number of blog writes actually tabulated. The alternate long and short dash line plots the predicted values. The “P1” time is the start time of the event. The hatched portion is a portion indicating a difference between the predicted value and the actually measured value.
図20に示すように、イベントの開始時期「P1」から、予測期間内において、予測値に対し、実際のブログ書き込み数が増加している。この増加分がイベントの影響により増加した書き込み数と推測される。 As shown in FIG. 20, from the event start time “P1”, the actual number of blog writes increases with respect to the predicted value within the prediction period. This increase is estimated to be the number of writes increased due to the event.
なお、本実施形態では、分析・可視化サーバ20は、実測値の合計を予測値の合計で除算した値を影響度としているが、予測値に対する実測値の増減の度合を示す値であれば、他の方法で影響度を算出してもよい。例えば、予測期間内のある日付における実測値と予測値との間の差分自体を影響度としてもよい。
In the present embodiment, the analysis /
以上説明したように、本実施形態によれば、分析・可視化サーバ20は、イベントの効果を定量的に測定することができる。
As described above, according to the present embodiment, the analysis /
(第3の実施形態)
本発明の第3の実施形態について説明する。本実施形態の時系列分析システムは、成長度スコアを更に算出できる点で、第1の実施形態の時系列分析システムと異なる。なお、本実施形態の時系列分析システムについて、図1〜図16で説明した構成と同様な構成の詳細な説明を省略し、第1の実施形態と異なる点について詳しく説明する。
(Third embodiment)
A third embodiment of the present invention will be described. The time series analysis system of this embodiment is different from the time series analysis system of the first embodiment in that a growth score can be further calculated. In addition, about the time series analysis system of this embodiment, the detailed description of the structure similar to the structure demonstrated in FIGS. 1-16 is abbreviate | omitted, and a different point from 1st Embodiment is demonstrated in detail.
本実施形態の利用者PC10は、時系列分析要求データの他、成長度スコアの算出を要求する成長度スコア算出要求データの入力を受け付ける。
The
成長度スコアとは、ある時期を教師データ期間の終日として算出された予測値に対する、それ以降の時期を教師データ期間の終日として算出された予測値の増減の度合を示す値である。例えば、教師データ期間の終日が遅い方の予測値の合計を、教師データ期間の終日が早い方の予測値の合計で除算した値を成長度スコアとする。 The growth degree score is a value indicating the degree of increase or decrease of the predicted value calculated with the time after that as the all day of the teacher data period with respect to the predicted value calculated with the certain period as the all day of the teacher data period. For example, the growth score is obtained by dividing the sum of the predicted values for the later day of the teacher data period by the sum of the predicted values for the earlier day of the teacher data period.
分析・可視化サーバ20は、成長度スコア算出要求データに基づいて、成長度スコアを算出する。
The analysis /
ここでは、最後にブログ書き込み数が集計された日付を「現在」とする。利用者は、「比較対象時期」として、その現在以前の日付を設定する。利用者は、現在を基準として現在以降の所定期間を予測期間に設定し、現在以前の所定期間を教師データ期間に設定する。 Here, the date when the number of blog writes at the end is counted is “present”. The user sets the date before the current time as the “comparison target time”. The user sets a predetermined period after the present as the prediction period based on the present, and sets a predetermined period before the present as the teacher data period.
例えば、利用者は、現在より1週間前の日付を比較対象時期に設定し、現在以降の2カ月間を予測期間に設定し、現在以前の1年間を教師データ期間に設定する。 For example, the user sets the date one week before the current time as the comparison target time, sets the two months after the current time as the prediction period, and sets the previous year as the teacher data period.
利用者PC10は、比較対象時期、予測期間、および教師データ期間を示す情報を含む成長度スコア算出要求データを分析・可視化サーバ20へ出力する。
The
図21は、成長度スコア算出要求データに含まれる情報を示す図である。同図を参照すると、影響度分析要求データには、「カテゴリ」、「キーワード」、「教師データ期間」、「予測期間」、および「比較対象時期」を示す情報を含む。 FIG. 21 is a diagram illustrating information included in the growth score calculation request data. Referring to the figure, the impact analysis request data includes information indicating “category”, “keyword”, “teacher data period”, “prediction period”, and “comparison target time”.
「カテゴリ」、「キーワード」は、第1の実施形態と同様である。「教師データ期間」、「予測期間」は、現在を基準に設定された教師データ期間、予測期間である。「比較対象時期」は、現在以前の所定の日付である。 “Category” and “Keyword” are the same as those in the first embodiment. “Teacher data period” and “prediction period” are a teacher data period and a prediction period set based on the current time. The “comparison time” is a predetermined date before the present time.
図22は、本実施形態の分析・可視化サーバ20の動作を示すフローチャートである。この動作は、分析・可視化サーバ20が成長度スコア算出要求データを受信したときに開始する。
FIG. 22 is a flowchart showing the operation of the analysis /
分析・可視化サーバ20は、成長度スコア算出要求データの示す、現在を基準とした「教師データ期間」、「予測期間」を設定する(ステップT3)。
The analysis /
分析・可視化サーバ20は、教師データ期間のブログ書き込み数の集計結果から、予測期間における予測値を算出するための時系列分析処理を実行する(ステップT4)。図22における時系列分析処理は、図8に示した時系列分析処理と同様の処理である。
The analysis /
次いで、分析・可視化サーバ20は、成長度スコア算出要求データの示す「教師データ期間」の長さは変えずに、その終日が「比較対象時期」になるように、「教師データ期間」を設定し直す。
Next, the analysis /
また、分析・可視化サーバ20は、成長度スコア算出要求データの示す「予測期間」の長さは変えずに、その初日が「比較対象時期」になるように、「予測期間」を設定し直す。
Also, the analysis /
つまり、分析・可視化サーバ20は、比較対象時期を基準とした教師データ期間、予測期間を設定する(ステップT5)。
That is, the analysis /
分析・可視化サーバ20は、新たに設定された教師データ期間、予測期間に基づいて、時系列分析処理を実行する(ステップT6)。
The analysis /
分析・可視化サーバ20は、現在を基準として算出された予測期間内の予測値の合計を、比較対象時期を基準として算出された予測期間内の予測値の合計で除算することにより、成長度スコアを算出する(ステップT7)。ステップT7の後、分析・可視化サーバ20は、動作を終了する。
The analysis /
図23を参照して、成長度スコアの算出結の一例について説明する。同図は、現在、比較対象時期のそれぞれを基準として算出された予測値をプロットした折れ線グラフである。同図における細い実線は、現在を基準とした教師データ期間の集計結果の一部をプロットしたものである。太い実線は、現在を基準とした予測期間内の予測値をプロットしたものである。一点鎖線は、比較対象時期を基準とした予測期間内の予測値をプロットしたものである。比較対象時期は1週間前に設定されたものとする。 With reference to FIG. 23, an example of the calculation result of the growth degree score will be described. This figure is a line graph in which the predicted values calculated based on the respective comparison target periods are plotted. The thin solid line in the figure plots a part of the total result of the teacher data period based on the present. The thick solid line is a plot of the predicted value within the prediction period based on the current time. The alternate long and short dash line plots the predicted values within the prediction period with the comparison target time as a reference. The comparison target time is set one week ago.
図23に示すように、1週間前を基準として算出された予測値よりも、現在を基準として算出された予測値は増加している。この予測値の増加率が成長度スコアとして算出される。 As shown in FIG. 23, the predicted value calculated on the basis of the present is higher than the predicted value calculated on the basis of one week ago. An increase rate of the predicted value is calculated as a growth score.
なお、本実施形態では、分析・可視化サーバ20は、現在を基準として算出された予測期間内の予測値の合計を、比較対象時期を基準として算出された予測期間内の予測値の合計で除算することにより、成長度スコアを算出している。
In the present embodiment, the analysis /
しかし、過去の時点の予測値に対する、それ以降における予測値の増減の度合を示す値であれば、他の算出方法で算出した値を成長度スコアとしてもよい。例えば、分析・可視化サーバ20は、現在を基準として算出された予測期間内の予測値の合計と、比較対象時期を基準として算出された予測期間内の予測値の合計との差分を成長度スコアとしてもよい。
However, as long as the value indicates the degree of increase / decrease in the predicted value thereafter with respect to the predicted value at the past time point, the value calculated by another calculation method may be used as the growth score. For example, the analysis /
また、本実施形態では、比較対象時期を1つだけ設定しているが、複数設定してもよいのは勿論である。例えば、分析・可視化サーバ20は、現在、その1週間前、1カ月前の3つの時点が設定されたとき、1週間前に対する現在の成長度、1カ月前に対する現在の成長度を算出する。
In this embodiment, only one comparison target time is set, but it is needless to say that a plurality of times may be set. For example, the analysis /
以上説明したように、本実施形態によれば、過去の予測値と、それ以降の予測値との差を成長度として定量化することができる。 As described above, according to the present embodiment, the difference between the past predicted value and the predicted value thereafter can be quantified as the degree of growth.
(第4の実施形態)
本発明の第4の実施形態について説明する。本実施形態の時系列分析システムは、イベントの効果を更に予測できる点で、第2の実施形態の時系列分析システムと異なる。なお、本実施形態の時系列分析システムについて、図17〜図20で説明した構成と同様な構成の詳細な説明を省略し、第2の実施形態と異なる点について詳しく説明する。
(Fourth embodiment)
A fourth embodiment of the present invention will be described. The time series analysis system of this embodiment is different from the time series analysis system of the second embodiment in that the effect of an event can be further predicted. In addition, about the time series analysis system of this embodiment, the detailed description of the structure similar to the structure demonstrated in FIGS. 17-20 is abbreviate | omitted, and a different point from 2nd Embodiment is demonstrated in detail.
本実施形態の利用者PC10は、時系列分析要求データの他、イベントの効果の予測を要求するシミュレーション要求データの入力を受け付ける。
The
利用者は、カテゴリ、キーワード、イベントの種類、イベントの開始時期、および予測期間を設定する。利用者PC10は、これらを示す情報を含むシミュレーション要求データを送信する。
The user sets the category, keyword, event type, event start time, and prediction period. The
分析・可視化サーバ20は、予測パラメータDB40に格納されたデータの中から、シミュレーション要求データの示すカテゴリと同一カテゴリに属し、類似するイベントを検索する。類似するイベントとは、キーワードの一部または全部が一致し、イベント種類が同じイベントである。分析・可視化サーバ20は、検索したイベントの予測式の成分を読み出す。また、分析・可視化サーバ20は、ブログDB30のブログデータから、検索したイベントのイベント開始時期以降の実測値を取得する。
The analysis /
分析・可視化サーバ20は、予測式から算出された予測値と、実測値とを表示するためのデータを利用者PC10へ送信する。
The analysis /
図24はシミュレーション要求データに含まれる情報を示す図である。同図を参照すると、シミュレーション要求データには、「カテゴリ」、「キーワード」、「イベント種類」、「イベント開始時期」、および「予測期間」を示す情報を含む。「カテゴリ」、「キーワード」、「イベント種類」、「イベント開始時期」、および「予測期間」の内容は、第2の実施形態と同様である。 FIG. 24 is a diagram showing information included in the simulation request data. Referring to the figure, the simulation request data includes information indicating “category”, “keyword”, “event type”, “event start time”, and “prediction period”. The contents of “category”, “keyword”, “event type”, “event start time”, and “prediction period” are the same as those in the second embodiment.
図25は、本実施形態の分析・可視化サーバ20の実行するイベント効果予測処理を示すフローチャートである。イベント効果予測処理は、分析・可視化サーバ20がシミュレーション要求データを受信したときに開始する。
FIG. 25 is a flowchart showing event effect prediction processing executed by the analysis /
分析・可視化サーバ20は、シミュレーション要求データの示すカテゴリと同一カテゴリに属し、類似するイベントを検索する。分析・可視化サーバ20は、検索したイベントの予測式の成分を読み出す。複数のイベントが検索された場合、それらのイベントの成分の平均値を算出する(ステップT11)。
The analysis /
分析・可視化サーバ20は、取得した成分から得た予測式で、シミュレーション要求データの示す予測期間における予測値を算出する(ステップT12)。
The analysis /
分析・可視化サーバ20は、ブログDB30から、検索したイベントのブログデータを読み出し、そのイベントの開始時期以降のブログ書き込み数の実測値を集計する。複数のイベントが検索された場合、それらのイベントの実測値の平均値を算出する。分析・可視化サーバ20は、イベント開始時期から、シミュレーション要求データの示す予測期間と同じ長さの期間が経過するまでの期間について集計する。
The analysis /
分析・可視化サーバ20は、予測値と実測値とを表示するためのデータを利用者PC10へ送信する(ステップT13)。ステップT13の後、分析・可視化サーバ20は、イベント効果予測処理を終了する。
The analysis /
以上説明したように、分析・可視化サーバ20は、過去の類似イベントの予測値と、実測値とを求めるので、イベントを実行した場合の効果をシミュレートできる。
As described above, the analysis /
1 時系列データ分析システム
10 利用者PC
20 分析・可視化サーバ
30 ブログDB
40 予測パラメータDB
201 ブログ抽出・集計部
202 トレンド成分学習部
203 周期成分学習部
204 分析結果作成部
2011 測定部
2012 特異点検出・補正部
1 Time-series
20 Analysis /
40 Prediction parameter DB
201 Blog extraction /
Claims (27)
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手段と、
前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手段と、
前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正する補正手段を有し、
前記トレンドパラメータ算出手段は、前記補正手段により外れ値が検出された場合、該補正手段により該外れ値が補正された前記時系列値から前記トレンドパラメータを算出し、
前記補正手段は、前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をy t 、自然数をm、該バースト期間におけるバースト値をBURSTとして、
Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, A periodic parameter calculating means for calculating the parameter of
By adding the trend function to which the trend parameter calculated by the trend parameter calculation means is applied and the periodic function to which the periodic parameter calculated by the periodic parameter calculation means is added, the particular function A prediction formula calculation means for calculating a prediction formula for predicting the transition of Web-related data;
Among the time series values, there is a correction unit that detects outliers that are suddenly increased or decreased, and corrects the outliers,
When the outlier is detected by the correcting unit, the trend parameter calculating unit calculates the trend parameter from the time series value in which the outlier is corrected by the correcting unit,
In the plurality of burst periods, each of which is a period when the time series values are aggregated, the correction means includes mintime as the first time in each burst period, and the last time in the burst period. Maxtime, α is a positive real number, t is a time when time series values are tabulated, y t is the time series value at time t , m is a natural number, and BURST is a burst value in the burst period.
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手段と、
前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手段と、
時系列値の値を予測すべき予測時期が入力されたとき、前記予測式算出手段により算出された前記予測式に、該予測時期を代入することにより、該予測時期における時系列値を予測値として算出する予測値算出手段と、
イベントが開催された時期から所定の期間が経過するまでに集計された時系列値と、前記予測値算出手段により該期間内で算出された予測値とに基づいて該イベントの影響度を算出する影響度算出手段とを有する時系列分析装置。 A function that represents an increase / decrease characteristic peculiar to Web-related data, a function whose parameter is undetermined is defined in advance as a trend function, and the parameter of the trend function is based on the time-series values of Web-related data aggregated for a specific matter Trend parameter calculation means for calculating as a trend parameter,
Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, A periodic parameter calculating means for calculating the parameter of
By adding the trend function to which the trend parameter calculated by the trend parameter calculation means is applied and the periodic function to which the periodic parameter calculated by the periodic parameter calculation means is added, the particular function A prediction formula calculation means for calculating a prediction formula for predicting the transition of Web-related data;
When a prediction time for predicting the value of the time series value is input, the time series value at the prediction time is converted into a prediction value by substituting the prediction time into the prediction formula calculated by the prediction formula calculation means. Predicted value calculation means for calculating as
The degree of influence of the event is calculated on the basis of the time-series values collected from the time when the event is held until the predetermined period elapses and the predicted value calculated within the period by the predicted value calculation means. A time-series analysis apparatus having an influence degree calculation means.
前記トレンドパラメータ算出手段は、前記補正手段により外れ値が検出された場合、該補正手段により該外れ値が補正された前記時系列値から前記トレンドパラメータを算出する、請求項6又は7に記載の時系列分析装置。 Among the time series values, it further includes a correcting unit that detects an outlier that is a value that suddenly increases or decreases, and corrects the outlier.
8. The trend parameter calculation unit according to claim 6 , wherein, when an outlier is detected by the correction unit, the trend parameter calculation unit calculates the trend parameter from the time-series value in which the outlier is corrected by the correction unit. Time series analyzer.
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手段と、
前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手段と、
時系列値の値を予測すべき予測時期が入力されたとき、前記予測式算出手段により算出された前記予測式に、該予測時期を代入することにより、該予測時期における時系列値を予測値として算出する予測値算出手段と、を有し、
前記予測値算出手段は、第1の集計期間と、第2の集計期間と、予測時期とが入力されたとき、該第1の集計期間内に集計された時系列値に基づいて第1の予測式を算出し、該第2の集計期間内に集計された時系列値に基づいて第2の予測式を算出し、該第1の予測式に該予測時期を代入して得た予測値に対する、該第2の予測式に該予測時期を代入して得た予測値の度合を成長度として算出する、時系列分析装置。 A function that represents an increase / decrease characteristic peculiar to Web-related data, a function whose parameter is undetermined is defined in advance as a trend function, and the parameter of the trend function is based on the time-series values of Web-related data aggregated for a specific matter Trend parameter calculation means for calculating as a trend parameter,
Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, A periodic parameter calculating means for calculating the parameter of
By adding the trend function to which the trend parameter calculated by the trend parameter calculation means is applied and the periodic function to which the periodic parameter calculated by the periodic parameter calculation means is added, the particular function A prediction formula calculation means for calculating a prediction formula for predicting the transition of Web-related data;
When a prediction time for predicting the value of the time series value is input, the time series value at the prediction time is converted into a prediction value by substituting the prediction time into the prediction formula calculated by the prediction formula calculation means. Predictive value calculation means for calculating as
The predicted value calculation means is configured to input a first aggregation period, a second aggregation period, and a prediction time based on a time series value aggregated within the first aggregation period when a prediction period is input. A prediction value obtained by calculating a prediction formula, calculating a second prediction formula based on the time series values aggregated within the second aggregation period, and substituting the prediction timing into the first prediction formula for, we calculate the degree of the predicted value obtained by substituting the predicted time to the prediction equation of the second as growth degree, time series analysis apparatus.
前記トレンドパラメータ算出手段は、前記補正手段により外れ値が検出された場合、該補正手段により該外れ値が補正された前記時系列値から前記トレンドパラメータを算出する、請求項12又は13に記載の時系列分析装置。 Among the time series values, it further includes a correcting unit that detects an outlier that is a value that suddenly increases or decreases, and corrects the outlier.
14. The trend parameter calculation unit according to claim 12 or 13 , wherein, when an outlier is detected by the correction unit, the trend parameter is calculated from the time series value in which the outlier is corrected by the correction unit. Time series analyzer.
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め保持した周期パラメータ算出手段が、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出し、
予測式算出手段が、前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出し、
前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正し、
前記トレンドパラメータを算出する際に、前記外れ値が検出された場合、該外れ値が補正された前記時系列値から前記トレンドパラメータを算出し、
前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をy t 、自然数をm、該バースト期間におけるバースト値をBURSTとして、
The periodic parameter calculation means that represents the periodicity peculiar to the Web-related data and previously holds a function whose parameter is undetermined as a periodic function is based on the time series value obtained by removing the trend function to which the trend parameter is applied. Calculating the parameters of the periodic function as periodic parameters;
The prediction formula calculation means adds the trend function to which the trend parameter calculated by the trend parameter calculation means is applied and the periodic function to which the periodic parameter calculated by the periodic parameter calculation means is added. , Calculating a prediction formula for predicting the transition of the web-related data related to the specific matter ,
Detecting outliers that are suddenly increased or decreased among the time series values, correcting the outliers,
When calculating the trend parameter, if the outlier is detected, the trend parameter is calculated from the time series value in which the outlier is corrected,
In a plurality of burst periods, each period of which the time series values are aggregated being the first period, the first period in each burst period is mintime, the last period in the burst period is maxtime, and positive The real number is α, the time when the time series values are tabulated, t, the time series value at time t is y t , the natural number is m, and the burst value in the burst period is BURST,
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出し、Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, Is calculated as a periodic parameter,
前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出し、By adding the trend function to which the trend parameter is applied and the periodic function to which the periodic parameter is applied, a prediction formula for predicting the transition of Web-related data related to the specific matter is calculated,
時系列値の値を予測すべき予測時期を前記予測式に代入することにより、該予測時期における時系列値を予測値として算出し、By substituting into the prediction formula the prediction time when the value of the time series value should be predicted, the time series value at the prediction time is calculated as the prediction value,
イベントが開催された時期から所定の期間が経過するまでに集計された時系列値と、該期間内で算出された予測値とに基づいて該イベントの影響度を算出する時系列分析方法。A time-series analysis method for calculating an influence degree of an event based on a time-series value totaled until a predetermined period elapses from a time when the event is held and a predicted value calculated within the period.
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出し、Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, Is calculated as a periodic parameter,
前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出し、By adding the trend function to which the trend parameter is applied and the periodic function to which the periodic parameter is applied, a prediction formula for predicting the transition of Web-related data related to the specific matter is calculated,
時系列値の値を予測すべき予測時期を前記予測式に代入することにより、該予測時期における時系列値を予測値として算出する時系列分析方法であって、A time series analysis method for calculating a time series value at a prediction time as a prediction value by substituting a prediction time at which a value of a time series value is to be predicted into the prediction formula,
第1の集計期間内に集計された時系列値に基づいて第1の予測式を算出し、第2の集計期間内に集計された時系列値に基づいて第2の予測式を算出し、第1の予測式に該予測時期を代入して得た予測値に対する、該第2の予測式に該予測時期を代入して得た予測値の度合を成長度として算出する、時系列分析方法。Calculating a first prediction formula based on a time series value aggregated within a first aggregation period, calculating a second prediction formula based on a time series value aggregated within a second aggregation period; A time-series analysis method for calculating a degree of growth of a prediction value obtained by substituting the prediction time into the second prediction formula with respect to a prediction value obtained by substituting the prediction time into the first prediction formula .
Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手順、
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手順、及び
前記トレンドパラメータ算出手順で算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手順で算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手順、
前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正する補正手順、
を実行させ、
前記トレンドパラメータ算出手順では、前記補正手順により外れ値が検出された場合、該補正手順により該外れ値が補正された前記時系列値から前記トレンドパラメータを算出し、
前記補正手順では、前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をy t 、自然数をm、該バースト期間におけるバースト値をBURSTとして、
A function that represents an increase / decrease characteristic peculiar to Web-related data, a function whose parameter is undetermined is defined in advance as a trend function, and the parameter of the trend function is based on the time-series values of Web-related data aggregated for a specific matter Trend parameter calculation procedure to calculate as a trend parameter,
Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, A periodic parameter calculation procedure for calculating the parameter of the above as a periodic parameter, the trend function to which the trend parameter calculated by the trend parameter calculation procedure is applied, and the periodic parameter calculated by the periodic parameter calculation procedure is applied. A prediction formula calculation procedure for calculating a prediction formula for predicting a transition of Web-related data related to the specific matter by adding a periodic function;
A correction procedure for detecting outliers that are suddenly increased or decreased among the time series values and correcting the outliers,
And execute
In the trend parameter calculation procedure, when an outlier is detected by the correction procedure, the trend parameter is calculated from the time series value in which the outlier is corrected by the correction procedure,
In the correction procedure, in a plurality of burst periods in which each period of the time series values is counted as the first period, the first period in each burst period is mintime, and the last period in the burst period Maxtime, α is a positive real number, t is a time when time series values are tabulated, y t is the time series value at time t , m is a natural number, and BURST is a burst value in the burst period.
Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手順、A function that represents an increase / decrease characteristic peculiar to Web-related data, a function whose parameter is undetermined is defined in advance as a trend function, and the parameter of the trend function is based on the time-series values of Web-related data aggregated for a specific matter Trend parameter calculation procedure to calculate as a trend parameter,
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手順、Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, A periodic parameter calculation procedure for calculating the parameter of as a periodic parameter,
前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手順、A prediction formula for calculating a prediction formula for predicting a transition of Web-related data related to the specific matter by adding the trend function to which the trend parameter is applied and the periodic function to which the periodic parameter is applied Calculation procedure,
時系列値の値を予測すべき予測時期を前記予測式に代入することにより、該予測時期における時系列値を予測値として算出する予測値算出手順、A prediction value calculation procedure for calculating a time series value at the prediction time as a prediction value by substituting a prediction time at which the value of the time series value is to be predicted into the prediction formula;
イベントが開催された時期から所定の期間が経過するまでに集計された時系列値と、該期間内で算出された予測値とに基づいて該イベントの影響度を算出する影響度算出手順、を実行させるプログラム。An influence calculation procedure for calculating the influence degree of the event based on the time-series values collected until the predetermined period elapses from the time when the event was held and the predicted value calculated within the period; The program to be executed.
Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手順、A function that represents an increase / decrease characteristic peculiar to Web-related data, a function whose parameter is undetermined is defined in advance as a trend function, and the parameter of the trend function is based on the time-series values of Web-related data aggregated for a specific matter Trend parameter calculation procedure to calculate as a trend parameter,
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手順、Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, A periodic parameter calculation procedure for calculating the parameter of as a periodic parameter,
前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手順、A prediction formula for calculating a prediction formula for predicting a transition of Web-related data related to the specific matter by adding the trend function to which the trend parameter is applied and the periodic function to which the periodic parameter is applied Calculation procedure,
時系列値の値を予測すべき予測時期を前記予測式に代入することにより、該予測時期における時系列値を予測値として算出する予測値算出手順、を実行させ、By substituting the prediction time when the value of the time series value should be predicted into the prediction formula, a prediction value calculation procedure for calculating the time series value at the prediction time as a prediction value is executed,
予測値算出手順では、第1の集計期間内に集計された時系列値に基づいて第1の予測式を算出し、第2の集計期間内に集計された時系列値に基づいて第2の予測式を算出したとき、第1の予測式に該予測時期を代入して得た予測値に対する、該第2の予測式に該予測時期を代入して得た予測値の度合を成長度として算出するプログラム。In the predicted value calculation procedure, the first prediction formula is calculated based on the time series values aggregated within the first aggregation period, and the second prediction value is calculated based on the time series values aggregated within the second aggregation period. When the prediction formula is calculated, the degree of growth is the degree of the prediction value obtained by substituting the prediction time into the second prediction formula with respect to the prediction value obtained by substituting the prediction time into the first prediction formula. The program to calculate.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009231488A JP5077711B2 (en) | 2009-10-05 | 2009-10-05 | Time series analysis apparatus, time series analysis method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009231488A JP5077711B2 (en) | 2009-10-05 | 2009-10-05 | Time series analysis apparatus, time series analysis method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011081491A JP2011081491A (en) | 2011-04-21 |
JP5077711B2 true JP5077711B2 (en) | 2012-11-21 |
Family
ID=44075502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009231488A Active JP5077711B2 (en) | 2009-10-05 | 2009-10-05 | Time series analysis apparatus, time series analysis method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5077711B2 (en) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5657585B2 (en) * | 2012-02-14 | 2015-01-21 | 日本電信電話株式会社 | Vocabulary learning curve parameter estimation apparatus, method, and program |
JP5604464B2 (en) * | 2012-02-14 | 2014-10-08 | 日本電信電話株式会社 | Vocabulary learning curve parameter estimation apparatus, method, and program |
JP5952711B2 (en) * | 2012-10-24 | 2016-07-13 | Kddi株式会社 | Prediction server, program and method for predicting future number of comments in prediction target content |
US9317812B2 (en) * | 2012-11-30 | 2016-04-19 | Facebook, Inc. | Customized predictors for user actions in an online system |
JP5952756B2 (en) * | 2013-02-26 | 2016-07-13 | Kddi株式会社 | Prediction server, program and method for predicting future number of comments in prediction target content |
JP6018024B2 (en) * | 2013-06-26 | 2016-11-02 | 日本電信電話株式会社 | CHANGE DETECTION DEVICE, CHANGE DETECTION SYSTEM, CHANGE DETECTION METHOD, AND PROGRAM |
JP2015011690A (en) * | 2013-07-02 | 2015-01-19 | ニフティ株式会社 | Effect measurement program, method, and device |
JP5841108B2 (en) * | 2013-09-24 | 2016-01-13 | ビッグローブ株式会社 | Information processing apparatus, article information generation method and program |
JP5622969B1 (en) * | 2014-02-04 | 2014-11-12 | 株式会社Ubic | Document analysis system, document analysis method, and document analysis program |
JP5627820B1 (en) * | 2014-02-04 | 2014-11-19 | 株式会社Ubic | Document analysis system, document analysis method, and document analysis program |
WO2015118619A1 (en) * | 2014-02-04 | 2015-08-13 | 株式会社Ubic | Document analysis system, document analysis method, and document analysis program |
JP6638351B2 (en) * | 2015-11-27 | 2020-01-29 | 富士通株式会社 | Analysis method, analysis program, analysis device, information display method, information display program, and information display device |
KR101924352B1 (en) * | 2017-04-19 | 2019-02-20 | 아시아나아이디티 주식회사 | Method for detecting issue based on trend analysis device thereof |
JP2019153115A (en) * | 2018-03-05 | 2019-09-12 | 東京瓦斯株式会社 | Gas data remote processing system, program and method |
KR101927872B1 (en) * | 2018-06-18 | 2018-12-12 | 현대멀티캡 주식회사 | Power saving computer using usage monitoring and core parking |
CN109933607B (en) * | 2019-01-25 | 2023-10-03 | 微诺时代(北京)科技股份有限公司 | Periodic time series data processing method |
JP6923864B1 (en) * | 2019-12-06 | 2021-08-25 | Arithmer株式会社 | Status judgment system, status judgment method and status judgment program |
CN113837503B (en) * | 2021-11-29 | 2022-03-29 | 新风光电子科技股份有限公司 | Power grid load prediction method and system based on artificial intelligence |
CN117056663B (en) * | 2023-10-13 | 2024-02-13 | 腾讯科技(深圳)有限公司 | Data processing method and device, electronic equipment and storage medium |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003281342A (en) * | 2002-03-25 | 2003-10-03 | Nri & Ncc Co Ltd | Method and system for analyzing effect of sales measure |
JP4185059B2 (en) * | 2005-02-18 | 2008-11-19 | 大日本印刷株式会社 | Trend prediction apparatus and trend prediction method |
JP4673727B2 (en) * | 2005-11-21 | 2011-04-20 | 株式会社リコー | Demand forecasting method and demand forecasting program |
JP4764864B2 (en) * | 2007-11-02 | 2011-09-07 | ヤフー株式会社 | Information propagation extracting apparatus and information propagation extracting method |
-
2009
- 2009-10-05 JP JP2009231488A patent/JP5077711B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011081491A (en) | 2011-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5077711B2 (en) | Time series analysis apparatus, time series analysis method, and program | |
JP5963709B2 (en) | Computer, prediction method, and prediction program | |
CN108647891B (en) | Data anomaly attribution analysis method and device | |
Davydenko et al. | Measuring forecasting accuracy: The case of judgmental adjustments to SKU-level demand forecasts | |
US20150142520A1 (en) | Crowd-based sentiment indices | |
JP6848230B2 (en) | Processing equipment, processing methods and programs | |
JP2011141833A (en) | Device, method, and program for stock price prediction | |
Karia et al. | Fractionally integrated ARMA for crude palm oil prices prediction: case of potentially overdifference | |
US8224690B2 (en) | Graphical risk-based performance measurement and benchmarking system and method | |
JP2009244981A (en) | Analysis apparatus, analysis method, and analysis program | |
JP2022143937A (en) | Information processing apparatus, information processing method, and information processing program | |
JP4777941B2 (en) | Demand forecasting method and apparatus | |
JP7235960B2 (en) | Job power prediction program, job power prediction method, and job power prediction device | |
US20130185315A1 (en) | Identification of Events of Interest | |
WO2019205381A1 (en) | Stock screening method and device, and computer-readable storage medium | |
JP6617605B2 (en) | Demand amount prediction program, demand amount prediction method, and information processing apparatus | |
WO2016072474A1 (en) | Information processing device, method, and program | |
EP4050536A1 (en) | Analysis device, control method, and program | |
Donglin et al. | Capital-embodied Technological Change and Its Contribution to Economic Growth: 1981-2007∗ | |
Chen et al. | Optimum process mean setting based on variable sampling plans with specified consumer’s risk | |
JP2020071523A (en) | Estimation method, charging method, computer, and program | |
JP2010282580A (en) | Apparatus, program, method and system for analyzing life cycle | |
Gauri | A test for suitability of the preliminary samples for constructing control limits of X chart | |
CN112256974A (en) | Public opinion information processing method and device | |
JP5600127B2 (en) | Information aggregation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120517 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120529 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120712 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120731 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120815 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150907 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5077711 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |