JP5077711B2 - Time series analysis apparatus, time series analysis method, and program - Google Patents

Time series analysis apparatus, time series analysis method, and program Download PDF

Info

Publication number
JP5077711B2
JP5077711B2 JP2009231488A JP2009231488A JP5077711B2 JP 5077711 B2 JP5077711 B2 JP 5077711B2 JP 2009231488 A JP2009231488 A JP 2009231488A JP 2009231488 A JP2009231488 A JP 2009231488A JP 5077711 B2 JP5077711 B2 JP 5077711B2
Authority
JP
Japan
Prior art keywords
value
parameter
trend
function
time series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009231488A
Other languages
Japanese (ja)
Other versions
JP2011081491A (en
Inventor
憲和 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biglobe Inc
Original Assignee
Biglobe Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biglobe Inc filed Critical Biglobe Inc
Priority to JP2009231488A priority Critical patent/JP5077711B2/en
Publication of JP2011081491A publication Critical patent/JP2011081491A/en
Application granted granted Critical
Publication of JP5077711B2 publication Critical patent/JP5077711B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、時系列データの推移を推測する技術に関する。   The present invention relates to a technique for estimating transition of time series data.

非特許文献1に示すように、ブログや掲示板上のクチコミ情報をリアルタイムに収集、分析するASP型サービスが各社から提供されている。但し、これらのサービスでは、将来のブログの書き込み数がどのように推移していくかは予測されない。   As shown in Non-Patent Document 1, each company provides an ASP type service that collects and analyzes word-of-mouth information on a blog or a bulletin board in real time. However, with these services, it is not predicted how the number of future blog entries will change.

ここで、経済や交通など、他の分野であれば、株価や交通情報の推移を予測する技術が用いられている。   Here, in other fields such as economy and traffic, a technology for predicting the transition of stock prices and traffic information is used.

例えば、特許文献1に記載された学習装置は、ブログの書き込み数を予測するものでないが、交通情報に関する時系列データを取得し、AR(Auto Regression)モデルのクラスを使用して、周期的なパターンを付加した、将来の予測値を算出することができる。   For example, the learning device described in Patent Document 1 does not predict the number of blog writes, but acquires time-series data related to traffic information and uses an AR (Auto Regression) model class to perform periodic analysis. It is possible to calculate a future predicted value to which a pattern is added.

[online]、[平成21年9月25日検索]、インターネット<URL:http://kandoreport.jp/>[online], [Search September 25, 2009], Internet <URL: http://kandoreport.jp/>

特開2006−11572号公報JP 2006-11572 A

しかし、特許文献1に記載された学習装置では、ブログの書き込み数など、Web関係のデータの推移を正確に予測できない場合があった。   However, the learning device described in Patent Literature 1 sometimes cannot accurately predict the transition of Web-related data such as the number of blog writes.

Web関係のデータの変動には、周期性のほか、特有の傾向も存在する。これに対し、特許文献1の学習装置は、周期的な変動を考慮して、予測値を算出するが、データが上昇傾向、下降傾向にあるといった特有の傾向については考慮していない。   In addition to periodicity, there is a unique tendency in fluctuations in Web-related data. On the other hand, the learning device of Patent Document 1 calculates a predicted value in consideration of periodic fluctuations, but does not take into account a specific tendency that the data has an upward trend or a downward trend.

このため、特許文献1に記載された技術をWeb関係のデータに適用すると、予測値と実際の値との間のずれが大きくなってしまうという問題があった。   For this reason, when the technique described in Patent Document 1 is applied to Web-related data, there is a problem that a deviation between the predicted value and the actual value becomes large.

本発明は、Web関係のデータの予測値を正確に求めることを目的とする。   An object of the present invention is to accurately obtain a predicted value of Web-related data.

上記目的を達成するために、本発明の時系列分析装置は、Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手段と、Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手段と、前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手段と、を有し、
前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正する補正手段を有し、
前記トレンドパラメータ算出手段は、前記補正手段により外れ値が検出された場合、該補正手段により該外れ値が補正された前記時系列値から前記トレンドパラメータを算出し、
前記補正手段は、前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をy t 、自然数をm、該バースト期間におけるバースト値をBURSTとして、後述する式1ないし式3により各バースト期間のバースト値を算出し、該バースト値の絶対値が高い順に所定個のバースト期間を抽出し、抽出した該バースト期間内の時系列値を外れ値として補正する。
In order to achieve the above-mentioned object, the time series analysis apparatus of the present invention represents an increase / decrease tendency peculiar to Web-related data, a function whose parameter is undetermined is previously defined as a trend function, and is aggregated for a specific matter. Trend parameter calculation means for calculating the parameter of the trend function as a trend parameter based on the time-series value of the Web-related data, and a periodicity peculiar to the Web-related data, and a function whose parameter is undetermined as a periodic function Based on the time series value that is defined in advance and the trend function to which the trend parameter is applied is removed, a periodic parameter calculation unit that calculates a parameter of the periodic function as a periodic parameter, and a calculation by the trend parameter calculation unit The trend function to which the trend parameter is applied, and the previous A prediction formula calculation means for calculating a prediction formula for predicting a transition of Web-related data related to the specific matter by adding the periodic function to which the periodic parameter calculated by the periodic parameter calculation means is applied; , have a,
Among the time series values, there is a correction unit that detects outliers that are suddenly increased or decreased, and corrects the outliers,
When the outlier is detected by the correcting unit, the trend parameter calculating unit calculates the trend parameter from the time series value in which the outlier is corrected by the correcting unit,
In the plurality of burst periods, each of which is a period when the time series values are aggregated, the correction means includes mintime as the first time in each burst period, and the last time in the burst period. , Maxtime is a positive real number, t is the time when the time series values are tabulated, y t is the time series value at time t , m is the natural number, and BURST is the burst value in the burst period. 3 calculates the burst value of each burst period, extracts a predetermined number of burst periods in descending order of the absolute value of the burst value, and corrects the extracted time-series values within the burst period as outliers.

本発明の時系列分析方法は、Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め保持したトレンドパラメータ算出手段が、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出し、Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め保持した周期パラメータ算出手段が、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出し、予測式算出手段が、前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出し、
前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正し、
前記トレンドパラメータを算出する際に、前記外れ値が検出された場合、該外れ値が補正された前記時系列値から前記トレンドパラメータを算出し、
前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をy t 、自然数をm、該バースト期間におけるバースト値をBURSTとして、後述する式1ないし式3により各バースト期間のバースト値を算出し、該バースト値の絶対値が高い順に所定個のバースト期間を抽出し、抽出した該バースト期間内の時系列値を外れ値として補正する、時系列分析方法である。
The time series analysis method according to the present invention represents a trend of increase or decrease peculiar to Web-related data, and the trend-parameter calculating means that holds in advance a function whose parameter is undetermined as a trend function has collected Web-related data for a specific matter. A periodic parameter calculation means for calculating a parameter of the trend function as a trend parameter based on the time series value of the time series, representing a periodicity peculiar to Web-related data, and holding a function whose parameter is undetermined in advance as a periodic function; Based on the time series value from which the trend function to which the trend parameter has been applied is removed, the parameter of the periodic function is calculated as a periodic parameter, and the prediction formula calculating means calculates the trend parameter calculated by the trend parameter calculating means. Applied trend function and periodic parameter calculation By adding the said periodic function of applying said periodic parameter calculated by the step, calculates a prediction equation for predicting a transition of data in Web relationships for the particular matter,
Detecting outliers that are suddenly increased or decreased among the time series values, correcting the outliers,
When calculating the trend parameter, if the outlier is detected, the trend parameter is calculated from the time series value in which the outlier is corrected,
In a plurality of burst periods, each period of which the time series values are aggregated being the first period, the first period in each burst period is mintime, the last period in the burst period is maxtime, and positive Assuming that the real number is α, the time when the time series values are aggregated is t, the time series value at the time t is y t , the natural number is m, and the burst value in the burst period is BURST, each burst period is expressed by the following formulas 1 to The burst value is calculated, a predetermined number of burst periods are extracted in descending order of the absolute value of the burst values, and the time series values in the extracted burst periods are corrected as outliers .

本発明のプログラムは、コンピュータに、Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手順、Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手順、及び前記トレンドパラメータ算出手順で算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手順で算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手順、
前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正する補正手順、
を実行させ、
前記トレンドパラメータ算出手順では、前記補正手順により外れ値が検出された場合、該補正手順により該外れ値が補正された前記時系列値から前記トレンドパラメータを算出し、
前記補正手順では、前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をy t 、自然数をm、該バースト期間におけるバースト値をBURSTとして、後述する式1ないし式3により各バースト期間のバースト値を算出し、該バースト値の絶対値が高い順に所定個のバースト期間を抽出し、抽出した該バースト期間内の時系列値を外れ値として補正するプログラムである。
The program of the present invention shows a time series of Web-related data aggregated with respect to a specific matter, in which a computer shows a tendency to increase or decrease specific to Web-related data, a function whose parameter is undetermined is previously defined as a trend function. A trend parameter calculation procedure for calculating a parameter of the trend function as a trend parameter based on a value, a periodicity peculiar to Web-related data, a function whose parameter is undetermined is previously defined as a periodic function, and the trend parameter Based on the time series value from which the trend function is applied, the periodic parameter calculation procedure for calculating the parameter of the periodic function as a periodic parameter, and the trend parameter calculated in the trend parameter calculation procedure is applied. Trend function and periodic parameter calculation By adding the said periodic function of applying said periodic parameter calculated in step, the prediction equation calculation step of calculating a prediction equation for predicting a transition of data in Web relationships for the particular matter,
A correction procedure for detecting outliers that are suddenly increased or decreased among the time series values and correcting the outliers,
And execute
In the trend parameter calculation procedure, when an outlier is detected by the correction procedure, the trend parameter is calculated from the time series value in which the outlier is corrected by the correction procedure,
In the correction procedure, in a plurality of burst periods in which each period of the period in which the time series values are aggregated is the first period, the first period in each burst period is mintime, and the last period in the burst period , Maxtime is a positive real number, t is the time when the time series values are tabulated, y t is the time series value at time t , m is the natural number, and BURST is the burst value in the burst period. 3 is a program for calculating a burst value of each burst period, extracting a predetermined number of burst periods in descending order of the absolute value of the burst value, and correcting the extracted time series values in the burst period as outliers .

本発明によれば、時系列分析装置は、Web関係のデータに特有の増減傾向や周期性を表す関数のパラメータを算出するので、周期性のほか、増減傾向も存在するブログなどに関する時系列値について、予測値を正確に算出できる。   According to the present invention, the time series analysis apparatus calculates the parameter of the function representing the increase / decrease tendency and periodicity peculiar to the Web-related data. Can accurately calculate the predicted value.

本発明の第1の実施形態の時系列データ分析システムの一構成例を示す全体図である。1 is an overall view showing a configuration example of a time-series data analysis system according to a first embodiment of the present invention. 本発明の第1の実施形態のブログ抽出・集計部の一構成例を示すブロック図である。It is a block diagram which shows one structural example of the blog extraction / aggregation part of the 1st Embodiment of this invention. 本発明の第1の実施形態の時系列分析要求データに含まれる情報を示す図である。It is a figure which shows the information contained in the time series analysis request data of the 1st Embodiment of this invention. 本発明の第1の実施形態の学習データの示す内容をまとめた表である。It is the table | surface which put together the content which the learning data of the 1st Embodiment of this invention shows. 本発明の第1の実施形態のバースト期間を可変して算出されたバースト値を示す表である。It is a table | surface which shows the burst value calculated by varying the burst period of the 1st Embodiment of this invention. (a)本発明の第1の実施形態の整列したバースト値を示す図である。(b)本発明の第1の実施形態の整列したバースト値を示す図である。(A) It is a figure which shows the aligned burst value of the 1st Embodiment of this invention. (B) It is a figure which shows the aligned burst value of the 1st Embodiment of this invention. 本発明の第1の実施形態の予測式データの示す内容をまとめた表である。It is the table | surface which put together the content which the prediction type | formula data of the 1st Embodiment of this invention shows. 本発明の第1の実施形態の分析・可視化サーバの時系列分析処理を示すフローチャートである。It is a flowchart which shows the time series analysis process of the analysis and visualization server of the 1st Embodiment of this invention. 本発明の第1の実施形態のブログ抽出・集計処理を示すフローチャートである。It is a flowchart which shows the blog extraction and totalization process of the 1st Embodiment of this invention. 本発明の第1の実施形態の周期成分抽出処理を示すフローチャートである。It is a flowchart which shows the periodic component extraction process of the 1st Embodiment of this invention. 外れ値の補正前における、本発明の第1の実施形態の時系列値をプロットした折れ線グラフである。It is the line graph which plotted the time series value of the 1st Embodiment of this invention before correction | amendment of an outlier. 外れ値の補正後における、本発明の第1の実施形態の時系列値をプロットした折れ線グラフである。It is the line graph which plotted the time series value of the 1st Embodiment of this invention after correction | amendment of an outlier. トレンド関数算出後における、本発明の第1の実施形態の時系列値をプロットした折れ線グラフである。It is the line graph which plotted the time series value of the 1st Embodiment of this invention after a trend function calculation. トレンド成分除去後における、本発明の第1の実施形態の時系列値をプロットした折れ線グラフである。It is the line graph which plotted the time series value of the 1st Embodiment of this invention after trend component removal. 本発明の第1の実施形態の予測値をプロットした折れ線グラフである。It is the line graph which plotted the predicted value of the 1st Embodiment of this invention. 本発明の第1の実施形態の予測値をプロットした折れ線グラフである。It is the line graph which plotted the predicted value of the 1st Embodiment of this invention. 本発明の第2の実施形態の影響度分析要求データに含まれる情報を示す図である。It is a figure which shows the information contained in the influence analysis request data of the 2nd Embodiment of this invention. 本発明の第2の実施形態の予測式データの示す内容をまとめた表である。It is the table | surface which put together the content which the prediction type | formula data of the 2nd Embodiment of this invention shows. 本発明の第2の実施形態の分析・可視化サーバの影響度分析処理を示すフローチャートである。It is a flowchart which shows the influence analysis process of the analysis and visualization server of the 2nd Embodiment of this invention. 本発明の第2の実施形態の予測値をプロットした折れ線グラフである。It is the line graph which plotted the predicted value of the 2nd Embodiment of this invention. 本発明の第3の実施形態の成長度スコア算出要求データに含まれる情報を示す図である。It is a figure which shows the information contained in the growth score calculation request data of the 3rd Embodiment of this invention. 本発明の第3の実施形態の分析・可視化サーバの成長度算出処理を示すフローチャートである。It is a flowchart which shows the growth calculation process of the analysis and visualization server of the 3rd Embodiment of this invention. 本発明の第3の実施形態の予測値をプロットした折れ線グラフである。It is the line graph which plotted the predicted value of the 3rd Embodiment of this invention. 本発明の第4の実施形態のシミュレーション要求データに含まれる情報を示す図である。It is a figure which shows the information contained in the simulation request data of the 4th Embodiment of this invention. 本発明の第4の実施形態のイベント効果予測処理を示すフローチャートである。It is a flowchart which shows the event effect prediction process of the 4th Embodiment of this invention.

本発明を実施するための形態について図面を参照して詳細に説明する。図1は、本実施形態の時系列データ分析システム1の一構成例を示す全体図である。時系列データ分析システムは、時系列で集計された値(以下、「時系列値」という)を示す時系列データを分析する。本実施形態では、時系列で集計されたブログの書き込み数を時系列値とする。   Embodiments for carrying out the present invention will be described in detail with reference to the drawings. FIG. 1 is an overall view showing a configuration example of a time-series data analysis system 1 according to the present embodiment. The time series data analysis system analyzes time series data indicating values aggregated in time series (hereinafter referred to as “time series values”). In the present embodiment, the number of blog writes totaled in time series is set as a time series value.

図1を参照すると、時系列データ分析システム1は、利用者PC10と、分析・可視化サーバ20と、ブログDB30と、予測パラメータDB40とを有する。   Referring to FIG. 1, the time-series data analysis system 1 includes a user PC 10, an analysis / visualization server 20, a blog DB 30, and a prediction parameter DB 40.

分析・可視化サーバ20は、ブログ抽出・集計部201、トレンド成分学習部202、周期成分学習部203、および分析結果作成部204を有する。   The analysis / visualization server 20 includes a blog extraction / aggregation unit 201, a trend component learning unit 202, a periodic component learning unit 203, and an analysis result creation unit 204.

ブログDB30は、ブログデータを収集し、それらのデータをカテゴリに分類して格納する。   The blog DB 30 collects blog data, classifies the data into categories, and stores the data.

利用者PC10は、時系列値の分析を要求する時系列分析要求データを受け付ける。時系列分析要求データが入力されると、利用者PC10は、その時系列分析要求データを分析・可視化サーバ20へ送信する。   The user PC 10 receives time series analysis request data for requesting analysis of time series values. When the time series analysis request data is input, the user PC 10 transmits the time series analysis request data to the analysis / visualization server 20.

図2は、時系列分析要求データに含まれる情報を示す図である。同図を参照すると、時系列分析要求データは、「カテゴリ」、「キーワード」、「教師データ期間」、および「予測期間」を示す情報を含む。   FIG. 2 is a diagram illustrating information included in the time series analysis request data. Referring to the figure, the time series analysis request data includes information indicating “category”, “keyword”, “teacher data period”, and “prediction period”.

「カテゴリ」は、集計対象のブログの属性である。例えば、飲料、電化製品、携帯電話、ビール、有名人など、キーワードのジャンルが指定される。「キーワード」は、ブログにおいて検索される語句である。「教師データ期間」は、ブログが集計される期間である。「予測期間」は、ブログの書き込み数の予測値が算出される期間である。   “Category” is an attribute of a blog to be counted. For example, keyword genres such as beverages, electrical appliances, mobile phones, beers, and celebrities are designated. A “keyword” is a phrase searched for in a blog. The “teacher data period” is a period during which blogs are tabulated. The “prediction period” is a period during which a predicted value of the number of blog writes is calculated.

図3は、ブログ抽出・集計部201の一構成例を示すブロック図である。同図を参照すると、ブログ抽出・集計部201は、集計部2011、および特異点補正部2012を有する。   FIG. 3 is a block diagram illustrating a configuration example of the blog extraction / aggregation unit 201. Referring to the figure, the blog extraction / aggregation unit 201 includes an aggregation unit 2011 and a singularity correction unit 2012.

集計部2011は、図2に示した時系列分析要求データから、カテゴリ、キーワード、教師データ期間、および予測範囲を取得する。集計部2011は、教師データ期間における、そのカテゴリに属するブログデータをブログDB30に格納されたブログデータから抽出する。集計部2011は、それらのブログデータから、キーワードを含むブログの書き込みを検索し、教師データ期間内の各日付において、検索されたブログの書き込み数を集計する。   The aggregation unit 2011 acquires a category, a keyword, a teacher data period, and a prediction range from the time series analysis request data illustrated in FIG. The aggregation unit 2011 extracts blog data belonging to the category in the teacher data period from the blog data stored in the blog DB 30. The tabulation unit 2011 searches the blog data for blog writings including keywords, and tabulates the number of blog writings searched for each date within the teacher data period.

特異点補正部2012は、集計結果から外れ値を検出し、補正する。外れ値は、不定期なイベントによる書き込み数の急増やシステム障害による書き込み数の急減・欠損など、時系列値が突発的に増減したときの値である。外れ値は、特異点とも呼ばれる。   The singularity correction unit 2012 detects and corrects outliers from the counting results. An outlier is a value when the time-series value suddenly increases or decreases, such as a sudden increase in the number of writes due to irregular events or a sudden decrease or loss in the number of writes due to a system failure. Outliers are also called singularities.

外れ値の抽出において、特異点補正部2012は、長さが最小値から最大値までの範囲で可変のバースト期間について、その長さを最小値に設定する。本実施形態では、最小値は1日に設定され、利用者は最大値のみを設定する。   In the outlier extraction, the singularity correction unit 2012 sets the length to the minimum value for the burst period whose length is variable in the range from the minimum value to the maximum value. In this embodiment, the minimum value is set for one day, and the user sets only the maximum value.

そして、特異点補正部2012は、バースト期間の初日を教師データ期間の初日とし、下記の式によりバースト値を算出する。以降、特異点補正部2012は、バースト期間の各日付をバースト期間の初日として、各日付に対応するバースト値を算出する。同様の手順で、特異点補正部2012は、最大値に達するまで、バースト期間の長さを可変し、各日付に対応するバースト値を算出する。   Then, the singularity correction unit 2012 uses the first day of the burst period as the first day of the teacher data period, and calculates the burst value using the following formula. Thereafter, the singularity correction unit 2012 calculates the burst value corresponding to each date, with each date in the burst period as the first day of the burst period. In a similar procedure, the singularity correction unit 2012 varies the length of the burst period until the maximum value is reached, and calculates a burst value corresponding to each date.

Figure 0005077711
Figure 0005077711

Figure 0005077711
Figure 0005077711

Figure 0005077711
上記(式1)において、「BURST」はバースト値であり、「α」は、長期間選択調整係数(例えば、2.5)である。「mintime」は、バースト期間内の最初の日付である。「maxtime」は、バースト期間内の最後の日付である。
Figure 0005077711
In the above (Formula 1), “BURST” is a burst value, and “α” is a long-term selection adjustment coefficient (for example, 2.5). “Mintime” is the first date in the burst period. “Maxtime” is the last date in the burst period.

上記(式3)において、「yi」は、「mintime」から数えて「i」番目の日付において集計されたブログの書き込み数である。「m」は、バースト期間の最大値以上で、教師データ期間の長さ以下の値(例えば、7)である。つまり、「SABUNi」は、「i」番目の日付において集計されたブログの書き込み数「yi」と、「i」番目の日付の「m」日前から「i」番目の日付までの間におけるブログの書き込み数の平均値と、の間の差分である。 In the above (Formula 3), “y i ” is the number of blog writes counted on the “i” -th date counted from “mintime”. “M” is a value (for example, 7) that is not less than the maximum value of the burst period and not more than the length of the teacher data period. In other words, “SABUN i ” is the number of blog writes “y i ” aggregated on the “i” th date, and “m” days before the “i” th date to the “i” th date. This is the difference between the average number of blog entries.

バースト期間の長さ「W」と、「m」の値とは、外れ値が適切に検出されるように調整される。例えば、外れ値を1日単位で検出したい場合は、「W」は0に設定される。また、外れ値が2日以上連続で出現することが多い場合、利用者は「W」を1以上に設定すればよい。「m」は、「W」の大きさに応じて適切な値が設定される。   The length of the burst period “W” and the value of “m” are adjusted so that outliers are properly detected. For example, when it is desired to detect outliers in units of one day, “W” is set to zero. In addition, when outliers often appear continuously for two days or more, the user may set “W” to 1 or more. “M” is set to an appropriate value according to the size of “W”.

あるバースト期間内に外れ値がある場合、そのバースト期間のバースト値の絶対値は、バースト期間内に外れ値のない場合よりも大きくなる。このため、特異点補正部2012は、バースト期間ごとに、バースト値を算出することで、どのバースト期間内に外れ値があるのかを効率的に判断できる。   When there is an outlier within a certain burst period, the absolute value of the burst value during that burst period is larger than when there is no outlier within the burst period. For this reason, the singularity correction unit 2012 can efficiently determine which burst period has an outlier by calculating a burst value for each burst period.

特異点補正部2012は、バースト値が高い順に各バースト期間をソートする。特異点補正部2012は、バースト値が高い所定個のバースト期間とバースト値の低い所定個のバースト期間とを、特異点を含むバースト期間として抽出する。例えば、上位、下位10個のバースト期間が抽出される。   The singularity correction unit 2012 sorts the burst periods in descending order of the burst value. The singularity correction unit 2012 extracts a predetermined number of burst periods having a high burst value and a predetermined number of burst periods having a low burst value as burst periods including singularities. For example, the upper and lower 10 burst periods are extracted.

但し、バースト期間の抽出においては、特異点補正部2012は、バースト値の絶対値の高い期間を優先してバースト期間を順に抽出する。そして、既に抽出したバースト期間と日付が重複するバースト期間は、抽出対象から除外する。   However, in the burst period extraction, the singularity correction unit 2012 extracts burst periods in order by giving priority to a period in which the absolute value of the burst value is high. Then, burst periods whose dates overlap with the already extracted burst periods are excluded from extraction targets.

特異点補正部2012は、抽出したバースト期間内の時系列値を外れ値として、それらの外れ値を補正する。例えば、特異点補正部2012は、直近データの平均値で補正する。但し、特異点補正部2012は、外れ値が最後のデータで、直後のデータがない場合、その外れ値を除外し、以下に説明する時系列分析において、その値を用いない。特異点補正部2012は、補正後の集計結果を示す学習データを出力する。   The singularity correction unit 2012 uses the extracted time series values within the burst period as outliers, and corrects these outliers. For example, the singularity correction unit 2012 corrects the average value of the latest data. However, if the outlier is the last data and there is no data immediately after it, the singularity correction unit 2012 excludes the outlier and does not use the value in the time series analysis described below. The singularity correction unit 2012 outputs learning data indicating the corrected total result.

図1に戻り、トレンド成分学習部202、周期成分学習部203、および分析結果作成部204について説明する。   Returning to FIG. 1, the trend component learning unit 202, the periodic component learning unit 203, and the analysis result creation unit 204 will be described.

トレンド成分学習部202は、特異点補正部2012が出力した学習データから、トレンドパラメータを算出する。   The trend component learning unit 202 calculates a trend parameter from the learning data output from the singular point correction unit 2012.

トレンドパラメータとは、教師データ期間におけるブログ書き込み数の増加傾向、または減少傾向を示す関数(以下、「トレンド関数」という)のパラメータである。例えば、トレンドパラメータとして、トレンド関数の係数や指数が算出される。   The trend parameter is a parameter of a function (hereinafter referred to as “trend function”) indicating an increasing tendency or a decreasing tendency of the number of blog entries during the teacher data period. For example, a trend function coefficient or index is calculated as the trend parameter.

トレンド関数は、例えば、下記の式で表わされる関数である。トレンド関数は、ブログ書き込み数の予測において、増減傾向のみが抽出された成分であるから、トレンド成分とも呼ばれる。   The trend function is a function represented by the following formula, for example. The trend function is also referred to as a trend component because it is a component in which only an increase / decrease tendency is extracted in the prediction of the number of blog entries.

Figure 0005077711
上記(式4)において、関数「y(x)」は、トレンド関数である。この「y(x)」の値は、教師データ期間における最初の日付から「x」日目におけるブログ書き込み数となる。「α」、「β」は、トレンドパラメータである。
Figure 0005077711
In the above (Formula 4), the function “y (x)” is a trend function. The value of “y (x)” is the number of blog writes on the “x” day from the first date in the teacher data period. “Α” and “β” are trend parameters.

トレンド成分学習部202は、例えば、最小ニ乗法を使用することにより、測定データを上記(式4)に近似し、トレンドパラメータを算出する。   The trend component learning unit 202 approximates the measurement data to the above (formula 4) by using, for example, the least-squares method, and calculates the trend parameter.

具体的には、下記の式に、測定値を代入することにより、トレンドパラメータを算出する。   Specifically, the trend parameter is calculated by substituting the measured value into the following equation.

Figure 0005077711
Figure 0005077711

Figure 0005077711
上記(式5)、(式6)において、「t」は教師データ期間内の最初の日からの日数であり、「Σ」は、教師データ期間における総和をとることを示している。「α」
、「β」は、トレンドパラメータである。「y」は、集計されたブログの書き込み数である。
Figure 0005077711
In the above (Expression 5) and (Expression 6), “t” is the number of days from the first day in the teacher data period, and “Σ” indicates that the sum in the teacher data period is taken. "Α"
, “Β” is a trend parameter. “Y” is the total number of written blogs.

トレンド成分学習部202は、算出したトレンドパラメータを適用したトレンド関数を導出し、学習データの各日付の書き込み数から、トレンド関数にその日付に対応する日数(「x」)を代入することで得られた書き込み数(「y(x)」)を減算する。   The trend component learning unit 202 derives a trend function to which the calculated trend parameter is applied, and obtains the trend function by substituting the number of days (“x”) corresponding to the date from the number of written learning data for each date. The written number (“y (x)”) is subtracted.

周期成分学習部203は、トレンド関数の算出値を減算した後の学習データをフーリエ解析することにより、周期パラメータを算出する。   The periodic component learning unit 203 calculates a periodic parameter by performing Fourier analysis on the learning data after subtracting the calculated value of the trend function.

周期パラメータとは、教師データ期間におけるブログ書き込み数、すなわち時系列値の周期的な変動を示す関数(以下、「周期関数」という)のパラメータである。例えば、周期パラメータとして、周期関数の係数や指数が算出される。   The periodic parameter is a parameter of a function (hereinafter referred to as “periodic function”) indicating the number of blog writings in the teacher data period, that is, a periodic variation of the time series value. For example, a periodic function coefficient or index is calculated as the periodic parameter.

周期関数は、例えば、下記の式で表わされる関数である。周期関数は、ブログ書き込み数の予測において、周期性のみが抽出された成分であるから、周期成分とも呼ばれる。   The periodic function is a function represented by the following formula, for example. Since the periodic function is a component in which only periodicity is extracted in the prediction of the number of blog writes, it is also called a periodic component.

Figure 0005077711
Figure 0005077711

Figure 0005077711
Figure 0005077711

Figure 0005077711
Figure 0005077711

Figure 0005077711
Figure 0005077711

Figure 0005077711
Figure 0005077711

Figure 0005077711
Figure 0005077711

Figure 0005077711
上記(式7)〜(式13)において、「Y(t)」は周期関数である。この「Y(t)」の値は、教師データ期間における最初の日付から「t」日目におけるブログ書き込み数となる。「An」、および「Bn」は、1年を周期とする周期パラメータである。「an」、および「bn」は、1週間を周期とする周期パラメータである。「n」は、フーリエ係数である。例えば、周期成分学習部203は、1〜5の「n」について、周期パラメータを算出し、それぞれを加算する。
Figure 0005077711
In the above (Expression 7) to (Expression 13), “Y (t)” is a periodic function. The value of “Y (t)” is the number of blog writes on the “t” day from the first date in the teacher data period. “An” and “Bn” are periodic parameters having a period of one year. “An” and “bn” are periodic parameters having a period of one week. “N” is a Fourier coefficient. For example, the periodic component learning unit 203 calculates periodic parameters for “n” of 1 to 5 and adds them.

分析結果作成部204は、トレンド関数と周期関数とを加算して、ブログ書き込み数の推移を予測するための予測式を生成する。   The analysis result creation unit 204 adds a trend function and a periodic function to generate a prediction formula for predicting the transition of the number of blog writes.

また、分析結果作成部204は、その予測式の各パラメータ、すなわちトレンドパラメータおよび周期パラメータを示す予測式データを予測パラメータDB40に格納する。   The analysis result creation unit 204 also stores, in the prediction parameter DB 40, prediction formula data indicating each parameter of the prediction formula, that is, a trend parameter and a periodic parameter.

そして、分析結果作成部204は、時系列分析要求データの示す予測期間内の各日付のブログ書き込み数を、予測式を使用して算出する。分析結果作成部204は、予測期間内で算出した値を予測値として、各予測値を示す分析結果データを利用者PC10へ送信する。   Then, the analysis result creation unit 204 calculates the number of blog writes for each date within the prediction period indicated by the time-series analysis request data using a prediction formula. The analysis result creation unit 204 transmits analysis result data indicating each predicted value to the user PC 10 using the value calculated within the prediction period as the predicted value.

また、分析結果作成部204は、時系列分析要求データの示すカテゴリ、キーワードが、以前にトレンド成分、周期成分を算出したカテゴリ、キーワードと同じであれば、以前に求めた予測式を用いて予測値を算出する。   In addition, the analysis result creation unit 204 predicts using the previously obtained prediction formula if the category and keyword indicated by the time series analysis request data are the same as the category and keyword for which the trend component and periodic component have been calculated previously. Calculate the value.

図4は、ブログ抽出・集計部201が作成する学習データの示す内容をまとめた表である。同図を参照すると、学習データは、「カテゴリ」、および「キーワード」に対応付けて、複数の「日付」および「書き込み件数」を示すデータを含む。「カテゴリ」は、抽出対象のブログデータが属するカテゴリである。「キーワード」は、ブログデータにおいて検索されたキーワードである。「日付」は、集計期間内の各日付である。「書き込み件数」は、キーワードを含むブログが書き込まれた件数である。   FIG. 4 is a table summarizing the contents indicated by the learning data created by the blog extraction / aggregation unit 201. Referring to the figure, the learning data includes data indicating a plurality of “dates” and “number of writings” in association with “category” and “keyword”. “Category” is a category to which the blog data to be extracted belongs. “Keyword” is a keyword searched in the blog data. “Date” is each date within the aggregation period. The “number of writes” is the number of blogs containing keywords.

例えば、時系列分析要求データの示すカテゴリが「食料品」で、キーワードとして「値上げ」が指定された場合について考える。ブログ抽出・集計部201は、「食料品」のカテゴリに属するブログデータについて、指定されたキーワードを検索する。ブログ抽出・集計部201は、キーワード「値上げ」を含むブログデータを抽出し、教師データ期間内、各日付のデータ数をそれぞれ集計する。   For example, consider a case where the category indicated by the time series analysis request data is “food” and “price increase” is specified as a keyword. The blog extraction / aggregation unit 201 searches for specified keywords for blog data belonging to the category of “groceries”. The blog extraction / aggregation unit 201 extracts blog data including the keyword “price increase”, and totals the number of data on each date within the teacher data period.

図5および図6を参照して、学習データから特異点を検出し、補正する方法について説明する。ここでは、バースト期間の長さを1日から7日に可変するものとする。また、上記(式3)における「m」を7に設定する。   A method for detecting and correcting a singular point from learning data will be described with reference to FIGS. Here, it is assumed that the length of the burst period is variable from 1 day to 7 days. Further, “m” in the above (Expression 3) is set to 7.

図5に示すように、ブログ抽出・集計部201は、バースト期間の長さ(バースト範囲)を1から7に可変し、教師データ期間内の各日付をバースト期間の初日としたバースト値を算出する。   As shown in FIG. 5, the blog extraction / aggregation unit 201 changes the burst period length (burst range) from 1 to 7, and calculates a burst value with each date in the teacher data period as the first day of the burst period. To do.

図5を参照すると、例えば、バースト範囲が1日で、「mintime」が2009年8月25日の場合のバースト値は「0」である。バースト範囲が2日で、「mintime」が2009年8月25日の場合、「maxtime」は2009年8月26日となり、バースト値は「22.5」である。   Referring to FIG. 5, for example, when the burst range is 1 day and “mintime” is August 25, 2009, the burst value is “0”. When the burst range is 2 days and “mintime” is August 25, 2009, “maxtime” is August 26, 2009, and the burst value is “22.5”.

ブログ抽出・集計部201は、図6(a)のように、各期間において算出したバースト値について降順でソートする。ブログ抽出・集計部201は、バースト値の上位から順にバースト期間を抽出する。   The blog extraction / aggregation unit 201 sorts the burst values calculated in each period in descending order as shown in FIG. The blog extraction / aggregation unit 201 extracts burst periods in order from the top of the burst value.

ここで、バースト値が同一の値となる期間が複数あった場合、バースト範囲の長い方が優先して抽出される。なお、バースト値の同じ期間が複数あっても、ブログ抽出・集計部201がいずれも抽出する構成としてもよい。   Here, when there are a plurality of periods in which the burst values are the same, the longer burst range is extracted with priority. Even if there are a plurality of periods with the same burst value, the blog extraction / aggregation unit 201 may extract all of them.

図6(a)を参照すると、最もバースト値が高いのは、バースト期間の初日を2009年8月28日、バースト範囲を1日として算出されたバースト値である。2番目にバースト値が高いのは、バースト期間の初日を2009年9月14日、バースト範囲を2日として算出されたバースト値である。3番目にバースト値が高いのは、2009年9月14日に対応するバースト値である。まず、これらの3つの期間が、外れ値を含みうるバースト期間として抽出される。   Referring to FIG. 6A, the highest burst value is a burst value calculated with the first day of the burst period being August 28, 2009 and the burst range being one day. The second highest burst value is a burst value calculated with the first day of the burst period being September 14, 2009 and the burst range being two days. The third highest burst value is the burst value corresponding to September 14, 2009. First, these three periods are extracted as burst periods that can include outliers.

そして、4番目にバースト値が高いのは、バースト期間の初日を2009年8月27日、バースト範囲を2日として算出されたバースト値であった。このバースト期間は、既に抽出されたバースト期間内の日付である8月28日を含む。このため、バースト期間の初日を2009年8月27日、バースト範囲を2日とするバースト期間は、抽出対象から除外される。図6(a)における斜線部分は、抽出対象から除外されたバースト期間である。これらのバースト期間が除外された結果を図6(b)に示す。   The fourth highest burst value was a burst value calculated with the first day of the burst period being August 27, 2009 and the burst range being two days. This burst period includes August 28, the date within the already extracted burst period. For this reason, the burst period in which the first day of the burst period is August 27, 2009 and the burst range is two days is excluded from the extraction target. The shaded portion in FIG. 6A is a burst period excluded from the extraction target. The result of excluding these burst periods is shown in FIG.

図5における、太い実線で囲まれた数字は、抽出されたバースト期間に対応するバースト値である。斜線で囲まれた数字は、この抽出済みのバースト期間と日付が重複するバースト期間に対応するバースト値である。これらの斜線で囲まれた部分に対応するバースト期間は、抽出対象から除外される。   In FIG. 5, the number surrounded by a thick solid line is a burst value corresponding to the extracted burst period. The numbers surrounded by diagonal lines are burst values corresponding to burst periods in which the extracted burst periods and dates overlap. Burst periods corresponding to these hatched parts are excluded from extraction targets.

ブログ抽出・集計部201は、図5、図6(a)の斜線部分に対応するバースト期間を除いた後、上位10個のバースト期間を抽出する。次に、最もバースト値が低いバースト値から順に、同様の方法で下位10個のバースト期間が抽出される。   The blog extraction / aggregation unit 201 extracts the top 10 burst periods after removing the burst periods corresponding to the shaded portions in FIGS. 5 and 6A. Next, in order from the burst value with the lowest burst value, the lower 10 burst periods are extracted in the same manner.

なお、上位、下位に関わらず、最も絶対値の大きなバースト値に対応するバースト期間から順に抽出される構成としてもよい。   In addition, it is good also as a structure extracted sequentially from the burst period corresponding to the burst value with the largest absolute value irrespective of a high-order and a low-order.

このように、日付が重複するバースト期間を抽出しないことにより、ブログ抽出・集計部201は、外れ値を精度よく検出できる。   Thus, the blog extraction / aggregation unit 201 can detect outliers with high accuracy by not extracting burst periods with overlapping dates.

そして、ブログ抽出・集計部201は、抽出したバースト期間内の値を、その前後の平均値に補正する。   Then, the blog extraction / aggregation unit 201 corrects the extracted value in the burst period to an average value before and after the extracted value.

図7は、予測式データの示す内容をまとめた図である。同図に示すように、予測式データは、「カテゴリ」、「キーワード」、「教師データ期間」、「トレンドパラメータ」、および「周期パラメータ」を示す情報を含む。   FIG. 7 is a table summarizing the contents of the prediction formula data. As shown in the figure, the prediction formula data includes information indicating “category”, “keyword”, “teacher data period”, “trend parameter”, and “periodic parameter”.

「カテゴリ」は、抽出対象のブログデータが属するカテゴリである。「キーワード」は、ブログデータにおいて検索されたキーワードである。「教師データ期間」は、予測式を算出するために時系列値が集計された期間である。「トレンドパラメータ」は、最小二乗法により算出されたトレンド関数のパラメータである。「周期パラメータ」は、フーリエ解析により算出された周期関数のパラメータである。   “Category” is a category to which the blog data to be extracted belongs. “Keyword” is a keyword searched in the blog data. The “teacher data period” is a period in which time series values are tabulated to calculate a prediction formula. The “trend parameter” is a parameter of a trend function calculated by the least square method. “Periodic parameter” is a parameter of a periodic function calculated by Fourier analysis.

続いて、分析・可視化サーバ20の動作について説明する。図8は、分析・可視化サーバ20の動作を示すフローチャートである。この動作は、分析・可視化サーバ20が時系列分析要求データを受信したときに開始する。   Next, the operation of the analysis / visualization server 20 will be described. FIG. 8 is a flowchart showing the operation of the analysis / visualization server 20. This operation starts when the analysis / visualization server 20 receives time-series analysis request data.

ブログ抽出・集計部201は、時系列分析要求データに基づいてブログデータを抽出し、集計するブログ抽出・集計処理を実行する(ステップS1)。   The blog extraction / aggregation unit 201 extracts blog data based on the time series analysis request data, and executes blog extraction / aggregation processing for aggregation (step S1).

トレンド成分学習部202は、集計結果を上記(4)式に近似することにより、トレンド成分を抽出する(ステップS2)。周期成分学習部203は、周期成分を抽出するための周期成分抽出処理を実行する(ステップS3)。   The trend component learning unit 202 extracts a trend component by approximating the counting result to the above equation (4) (step S2). The periodic component learning unit 203 executes a periodic component extraction process for extracting a periodic component (step S3).

分析結果作成部204は、トレンドパラメータ、周期パラメータを予測パラメータDB40に格納し、トレンド関数および周期関数を加算して予測式を作成する(ステップS4)。分析結果作成部204は、予測式から、指定された予測期間における時系列値の予測値を算出し、分析結果データを利用者PC10へ出力する(ステップS5)。ステップS5の後、分析・可視化サーバ20は動作を終了する。   The analysis result creation unit 204 stores the trend parameter and the periodic parameter in the prediction parameter DB 40, and creates a prediction formula by adding the trend function and the periodic function (step S4). The analysis result creation unit 204 calculates the predicted value of the time series value in the designated prediction period from the prediction formula, and outputs the analysis result data to the user PC 10 (step S5). After step S5, the analysis / visualization server 20 ends the operation.

図9は、ブログ抽出・集計処理を示すフローチャートである。同図を参照すると、ブログ抽出・集計部201は、教師データ期間内において、時系列分析要求データで指定されたカテゴリ、キーワードと全部一致または部分一致する単語を含むブログを抽出し、集計する(ステップS11)。   FIG. 9 is a flowchart showing blog extraction / aggregation processing. Referring to the figure, the blog extraction / aggregation unit 201 extracts and aggregates blogs that include words that match all or partially match the category and keyword specified in the time series analysis request data within the teacher data period ( Step S11).

ブログ抽出・集計部201は、教師データ期間をバースト期間ごとに分割し、各バースト期間におけるバースト値を算出する。そして、ブログ抽出・集計部201は、バースト値が高い所定個のバースト期間を抽出することにより特異点を検出し、補正する(ステップS12)。ステップS12の後、ブログ抽出・集計部201は、ブログ抽出・集計処理を終了する。   The blog extraction / aggregation unit 201 divides the teacher data period for each burst period, and calculates a burst value in each burst period. Then, the blog extraction / aggregation unit 201 detects and corrects a singular point by extracting a predetermined number of burst periods having a high burst value (step S12). After step S12, the blog extraction / counting unit 201 ends the blog extraction / counting process.

図10は、周期成分抽出処理を示すフローチャートである。同図を参照すると、周期成分学習部203は、上記(式8)、(式9)を使用して年単位の周期パラメータAn、Bnを算出する(ステップS31)。そして、周期成分学習部203は、上記(式10)、(式11)を使用して年単位の周期パラメータan、bnを算出する(ステップS32)。ステップS32の後、周期成分学習部203は、周期成分抽出処理を終了する。   FIG. 10 is a flowchart showing the periodic component extraction process. Referring to the figure, the periodic component learning unit 203 calculates yearly periodic parameters An and Bn using the above (Expression 8) and (Expression 9) (step S31). Then, the periodic component learning unit 203 calculates the yearly periodic parameters an and bn using the above (formula 10) and (formula 11) (step S32). After step S32, the periodic component learning unit 203 ends the periodic component extraction process.

図11〜図15を参照して、分析・可視化サーバ20の動作結果の一例について説明する。図11は、分析・可視化サーバ20が、時系列分析要求データに基づいて、教師データ期間でブログの書き込み数を集計した結果をプロットした折れ線グラフである。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。   An example of the operation result of the analysis / visualization server 20 will be described with reference to FIGS. FIG. 11 is a line graph in which the analysis / visualization server 20 plots the result of totaling the number of blog writes during the teacher data period based on the time-series analysis request data. In the figure, the horizontal axis represents each counting date within the teacher data period, and the vertical axis represents the number of blog writes counted on the counting date.

分析・可視化サーバ20は、教師データ期間を、複数のバースト期間に分割し、上記(式1)を使用して、各バースト期間におけるバースト値を算出する。同図に示すように、B1において書き込み数が突発的に増加し、B2において書き込み数が突発的に減少しているので、これらのB1,B2を含むバースト期間において、バースト値の絶対値が高くなる。分析・可視化サーバ20は、これらバースト期間内の外れ値を補正する。   The analysis / visualization server 20 divides the teacher data period into a plurality of burst periods, and calculates a burst value in each burst period using the above (Equation 1). As shown in the figure, the number of writes suddenly increases at B1 and the number of writes suddenly decreases at B2, so that the absolute value of the burst value is high in the burst period including these B1 and B2. Become. The analysis / visualization server 20 corrects outliers within these burst periods.

図12は特異点を補正した後の集計結果を示す折れ線グラフである。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。同図に示すように、特異点B1,B2は、いずれも補正されている。   FIG. 12 is a line graph showing the counting result after correcting the singular points. In the figure, the horizontal axis represents each counting date within the teacher data period, and the vertical axis represents the number of blog writes counted on the counting date. As shown in the figure, the singular points B1 and B2 are both corrected.

図13は、分析・可視化サーバ20が、集計結果からトレンド成分を求めた結果を示す図である。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。集計結果から、最小二乗法により、同図の一点鎖線で表わされる対数関数が導出される。同図に示すように、ブログの書き込み件数の推移には、時間の経過とともに徐々に増加してゆく傾向、すなわちトレンドがある。   FIG. 13 is a diagram illustrating a result of the trend component being obtained by the analysis / visualization server 20 from the aggregation result. In the figure, the horizontal axis represents each counting date within the teacher data period, and the vertical axis represents the number of blog writes counted on the counting date. A logarithmic function represented by a one-dot chain line in FIG. As shown in the figure, the transition of the number of blog entries has a tendency to gradually increase with time, that is, a trend.

図14は、分析・可視化サーバ20が集計結果からトレンド成分を除去し、周期成分を求めた結果を示す図である。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。集計結果から、フーリエ解析より、同図のニ点鎖線で表わされる周期関数が導出される。同図に示すように、ブログの書き込み件数は、年単位で周期的に変化し、週単位でも周期的に変化する。   FIG. 14 is a diagram illustrating a result of the trend component obtained by the analysis / visualization server 20 removing the trend component from the counting result. In the figure, the horizontal axis represents each counting date within the teacher data period, and the vertical axis represents the number of blog writes counted on the counting date. From the total result, a periodic function represented by a two-dot chain line in FIG. As shown in the figure, the number of blog entries changes periodically on a yearly basis and also periodically on a weekly basis.

図15は、分析・可視化サーバ20が、予測式を使用して予測値を算出した結果を示す折れ線グラフである。同図における、横軸が、教師データ期間内の各集計日であり、縦軸が、集計日に集計されたブログの書き込み数である。同図の実線の部分は、特異点を補正した集計結果であり、同図の二点鎖線の部分は、予測式で算出した予測期間内の予測値をプロットした結果である。同図に示すように、分析・可視化サーバ20は、予測式を使用することにより、今後のブログ書き込み数の推移を予測することができる。   FIG. 15 is a line graph showing the result of the prediction value calculated by the analysis / visualization server 20 using the prediction formula. In the figure, the horizontal axis represents each counting date within the teacher data period, and the vertical axis represents the number of blog writes counted on the counting date. The solid line part in the figure is the total result obtained by correcting the singular points, and the two-dot chain line part in the figure is the result of plotting the predicted values within the prediction period calculated by the prediction formula. As shown in the figure, the analysis / visualization server 20 can predict the future transition of the number of blog writes by using the prediction formula.

分析・可視化サーバ20は、異なる条件で集計された集計結果や、異なる条件で算出された分析結果を、比較のために同時に表示することもできる。   The analysis / visualization server 20 can also simultaneously display the aggregation results calculated under different conditions and the analysis results calculated under different conditions for comparison.

図16は、同じカテゴリにおいて、類似する製品「製品A」、「製品B」をキーワードとして集計された集計結果と算出された分析結果とを示す折れ線グラフである。同図において、実線の部分が、これらのキーワードについての集計結果である。破線の部分が、これらのキーワードについての予測値をプロットしたものである。   FIG. 16 is a line graph showing a totaled result obtained by counting similar products “product A” and “product B” as keywords in the same category and a calculated analysis result. In the figure, the solid line portion is the total result for these keywords. The broken line is a plot of the predicted values for these keywords.

利用者は、各製品に関する書き込み数がどのように推移するかを比較し、どのように商品の販売、宣伝などを実行するかを検討することができる。   The user can compare how the number of writings related to each product changes, and can consider how to execute sales or promotion of the product.

なお、本実施形態では、分析・可視化サーバ20は、ブログの書き込み数を時系列値として収集しているが、時系列で収集された値であれば、他の時系列値を収集し、分析することもできる。例えば、時系列値は、ブログ以外のWeb関係のデータであってもよい。Web関係のデータは、Webページの記事数や、記事が検索された回数、Webサイトへのアクセスログなどである。   In this embodiment, the analysis / visualization server 20 collects the number of blog writes as a time-series value. However, if the value is collected in time-series, it collects and analyzes other time-series values. You can also For example, the time series value may be Web-related data other than a blog. The web-related data includes the number of articles on the web page, the number of times the article has been searched, an access log to the website, and the like.

また、時系列値は、株価、為替とすることも可能である。若しくは、分析・可視化サーバ20は、CPU使用率などのシステムログデータなどを時系列値として分析することもできる。   Further, the time series value may be a stock price or an exchange rate. Alternatively, the analysis / visualization server 20 can also analyze system log data such as a CPU usage rate as a time series value.

本実施形態では、分析・可視化サーバ20は、1日ごとにブログ書き込み数を集計しているが、集計する時期は、教師データ期間内の時期であれば、1日に限らない。例えば、分析・可視化サーバ20は、1時間ごとにブログ書き込み数を集計してもよい。   In the present embodiment, the analysis / visualization server 20 totals the number of blog writes every day, but the totaling time is not limited to one day as long as it is within the teacher data period. For example, the analysis / visualization server 20 may count the number of blog writes every hour.

本実施形態では、分析・可視化サーバ20は、上記(式1)〜(式3)を使用して外れ値を検出しているが、突発的に増減する値を検出できるのであれば、これらの数式以外の式を使用して外れ値を検出してもよい。   In this embodiment, the analysis / visualization server 20 detects outliers using the above (Expression 1) to (Expression 3), but if these values can be detected suddenly, these An outlier may be detected using an expression other than an expression.

例えば、上記(式3)において、平均値と「yi」との間の差分を「SABUNi」としているが、差分の絶対値を「SABUNi」として算出してもよい。この場合、分析・可視化サーバ20は、バースト値の上位、所定個のバースト期間を抽出する。 For example, in the above (Equation 3), the difference between the average value and “y i ” is “SABUN i ”, but the absolute value of the difference may be calculated as “SABUN i ”. In this case, the analysis / visualization server 20 extracts a high-order burst period and a predetermined number of burst periods.

本実施形態では、分析・可視化サーバ20は、上記(式4)のように、集計結果を対数関数に近似しているが、対数関数以外の関数に近似してもよいのは勿論である。例えば、分析・可視化サーバ20は、下記に示すような式を用いて線形近似を行ってもよい。   In the present embodiment, the analysis / visualization server 20 approximates the aggregation result to a logarithmic function as in the above (Equation 4), but it goes without saying that the analysis / visualization server 20 may approximate a function other than the logarithmic function. For example, the analysis / visualization server 20 may perform linear approximation using an expression as shown below.

Figure 0005077711
または、分析・可視化サーバ20は、下記に示すような式を用いて累乗近似を行ってもよい。
Figure 0005077711
Alternatively, the analysis / visualization server 20 may perform power approximation using an expression as shown below.

Figure 0005077711
もしくは、分析・可視化サーバ20は、下記に示すような式を用いて指数近似を行ってもよい。
Figure 0005077711
Alternatively, the analysis / visualization server 20 may perform exponential approximation using an expression as shown below.

Figure 0005077711
上記(式14)〜(式16)において、「α」、「β」はトレンドパラメータ、「y」はブログ書き込み数、「x」は集計日である。
Figure 0005077711
In the above (Expression 14) to (Expression 16), “α” and “β” are trend parameters, “y” is the number of blog writes, and “x” is a counting date.

本実施形態では、分析・可視化サーバ20は、1年を周期とする周期成分と、1週間を周期とする周期成分とを求めているが、これらと異なる周期の周期成分を求めてもよいのは勿論である。例えば、ブログの書き込み数が1時間ごとに集計される場合、分析・可視化サーバ20は、周期を1日とする周期成分を算出することもできるし、周期を1年でなく、2年や3年としてもよい。   In the present embodiment, the analysis / visualization server 20 obtains a periodic component having a cycle of one year and a periodic component having a cycle of one week. However, a periodic component having a different period may be obtained. Of course. For example, when the number of blog writes is counted every hour, the analysis / visualization server 20 can also calculate a periodic component with a period of one day, and the period is not one year but two years or three. It may be a year.

本実施形態の分析・可視化サーバ20は、トレンド成分の算出において、最小ニ乗法を使用しているが、集計結果を回帰分析できるのであれば、最小二乗法以外の手法により、トレンド成分を算出してもよい。   The analysis / visualization server 20 of the present embodiment uses the least-squares method in calculating trend components, but if the regression results can be analyzed, the trend components are calculated by a method other than the least-squares method. May be.

本実施形態の分析・可視化サーバ20は、フーリエ解析を行うことにより、周期成分を算出しているが、周期的な変動パターンを求めることができるのであれば、フーリエ解析以外の手法により周期成分を算出してよい。例えば、分析・可視化サーバ20は、AR(Autoregressive model)モデルを使用することにより、周期成分を求めることが可能である。   The analysis / visualization server 20 of this embodiment calculates a periodic component by performing Fourier analysis. However, if a periodic variation pattern can be obtained, the periodic component is obtained by a method other than Fourier analysis. It may be calculated. For example, the analysis / visualization server 20 can obtain a periodic component by using an AR (Autoregressive model) model.

以上説明したように、本実施形態によれば、時系列分析装置は、Web関係のデータに特有の増減傾向や周期性を表す関数のパラメータを算出するので、時系列値に、周期性のほか、増減傾向があっても、予測値を正確に算出できる。   As described above, according to the present embodiment, the time series analysis apparatus calculates the function parameters representing the increase / decrease tendency and the periodicity peculiar to the Web-related data. Even if there is a tendency to increase or decrease, the predicted value can be calculated accurately.

(第2の実施形態)
本発明の第2の実施形態について説明する。本実施形態の時系列分析システムは、イベントの影響度を更に算出できる点で、第1の実施形態の時系列分析システムと異なる。なお、本実施形態の時系列分析システムについて、図1〜図16で説明した構成と同様な構成の詳細な説明を省略し、第1の実施形態と異なる点について詳しく説明する。
(Second Embodiment)
A second embodiment of the present invention will be described. The time series analysis system according to the present embodiment is different from the time series analysis system according to the first embodiment in that an event influence degree can be further calculated. In addition, about the time series analysis system of this embodiment, the detailed description of the structure similar to the structure demonstrated in FIGS. 1-16 is abbreviate | omitted, and a different point from 1st Embodiment is demonstrated in detail.

本実施形態の利用者PC10は、時系列分析要求データの他、イベントの影響度の算出を要求する影響度分析要求データの入力を受け付ける。イベントの影響度とは、イベントを実行後の、実際のブログの書き込み数が予測値に対して増減した度合を示す値である。例えば、分析・可視化サーバ20は、実際の書き込み数を予測値で割った値を影響度とする。   The user PC 10 of the present embodiment accepts input of influence degree analysis request data for requesting calculation of the influence degree of an event in addition to time series analysis request data. The event influence level is a value indicating the degree to which the actual number of blog writes after the event is executed is increased or decreased with respect to the predicted value. For example, the analysis / visualization server 20 uses the value obtained by dividing the actual number of writes by the predicted value as the degree of influence.

具体的には、イベントの開始から一定期間が経過した時点におけるイベントの影響度を求めたいとき、利用者は、イベントの種類、イベントの開始時期、予測期間、および教師データ期間を利用者PC10に入力する。ここで、イベントの開始時期以前の所定期間が教師データ期間として設定される。また、イベントの開始時期以降の所定期間が予測期間として設定される。本実施形態では、教師データ期間の長さは、予測期間の長さ以上に設定されることが望ましい。   Specifically, when the user wants to determine the degree of influence of an event when a certain period has elapsed since the start of the event, the user sets the event type, event start time, prediction period, and teacher data period to the user PC 10. input. Here, a predetermined period before the start time of the event is set as the teacher data period. Further, a predetermined period after the event start time is set as the prediction period. In the present embodiment, it is desirable that the length of the teacher data period is set to be equal to or longer than the length of the prediction period.

例えば、イベントの開始から1カ月感が経過し、その1カ月間におけるイベントの影響度を算出したい場合、利用者は、イベント開始以前の1年間を教師データ期間、イベント開始時から1カ月間の期間を予測期間として入力する。   For example, when a sense of one month has passed since the start of the event and it is desired to calculate the degree of influence of the event during that one month, the user can use the one year before the start of the event for the teacher data period and the first month of the event. Enter the period as the forecast period.

利用者PC10は、イベントの種類、イベントの開始時期、予測期間、および教師データ期間を示す情報を含む影響度分析要求データを分析・可視化サーバ20へ出力する。   The user PC 10 outputs impact analysis request data including information indicating an event type, an event start time, a prediction period, and a teacher data period to the analysis / visualization server 20.

図17は、影響度分析要求データに含まれる情報を示す図である。同図を参照すると、影響度分析要求データには、「カテゴリ」、「キーワード」、「イベント種類」、「教師データ期間」、および「予測期間」を示す情報を含む。   FIG. 17 is a diagram illustrating information included in the impact analysis request data. Referring to the figure, the impact analysis request data includes information indicating “category”, “keyword”, “event type”, “teacher data period”, and “prediction period”.

「カテゴリ」、「キーワード」は、第1の実施形態と同様である。「教師データ期間」は、イベント開始時期以前の所定期間である。「予測期間」は、イベント開始時期以降の所定期間である。   “Category” and “Keyword” are the same as those in the first embodiment. The “teacher data period” is a predetermined period before the event start time. The “prediction period” is a predetermined period after the event start time.

影響度分析要求データが入力されたとき、分析・可視化サーバ20は、第1の実施形態と同様の方法で予測式を求め、その予測式から、予測期間内の各日付の予測値を算出する。   When the impact analysis request data is input, the analysis / visualization server 20 obtains a prediction formula by the same method as in the first embodiment, and calculates a prediction value for each date within the prediction period from the prediction formula. .

一方、分析・可視化サーバ20は、予測期間内におけるブログデータをブログDB30から読み出し、予測期間における実際のブログ書き込み数を集計して実測値とする。そして、分析・可視化サーバ20は、予測期間内の実測値の合計を、予測期間内の予測値の合計で除算して得た値をイベントの影響度とする。   On the other hand, the analysis / visualization server 20 reads the blog data in the prediction period from the blog DB 30 and totals the actual number of blog writes in the prediction period to obtain an actual measurement value. Then, the analysis / visualization server 20 sets the value obtained by dividing the total of the actual measurement values in the prediction period by the total of the prediction values in the prediction period as the event influence level.

分析・可視化サーバ20は、予測値、実測値を表示するための分析結果データを利用者PC10へ送信する。また、分析・可視化サーバ20は、イベントの種類、影響度を示す情報を更に含む予測式データを予測パラメータDB40に格納する。   The analysis / visualization server 20 transmits analysis result data for displaying the predicted value and the actual measurement value to the user PC 10. The analysis / visualization server 20 stores prediction formula data further including information indicating the type of event and the degree of influence in the prediction parameter DB 40.

図18は、予測式データの示す内容をまとめた図である。同図に示すように、予測式データは、「カテゴリ」、「キーワード」、「教師データ期間」、「トレンドパラメータ」、および「周期パラメータ」を示す情報に加え、「イベント」および「影響度」を示す情報を含む。   FIG. 18 is a table summarizing the contents indicated by the prediction formula data. As shown in the figure, in addition to information indicating “category”, “keyword”, “teacher data period”, “trend parameter”, and “periodic parameter”, the prediction formula data includes “event” and “influence degree”. Contains information indicating.

「イベント」は、分析対象のイベントの種類である。「影響度」は、実測値と予測値とから得られるイベントの影響度である。   “Event” is the type of event to be analyzed. The “influence degree” is the influence degree of the event obtained from the actual measurement value and the predicted value.

図19は、本実施形態の分析・可視化サーバ20の動作を示すフローチャートである。この動作は、分析・可視化サーバ20が影響度分析要求データを受信したときに開始する。   FIG. 19 is a flowchart showing the operation of the analysis / visualization server 20 of the present embodiment. This operation starts when the analysis / visualization server 20 receives the impact analysis request data.

分析・可視化サーバ20は、教師データ期間のブログ書き込み数の集計結果から、予測期間における予測値を算出するための時系列分析処理を実行する(ステップT1)。図19における時系列分析処理は、図8に示した時系列分析処理と同様の処理である。   The analysis / visualization server 20 executes a time series analysis process for calculating a predicted value in the prediction period from the total number of blog writings in the teacher data period (step T1). The time series analysis process in FIG. 19 is the same process as the time series analysis process shown in FIG.

分析・可視化サーバ20は、予測期間内の実測値の合計を、予測期間内の予測値の合計で除算することにより、イベントの影響度を算出する(ステップT2)。   The analysis / visualization server 20 calculates the influence degree of the event by dividing the total of the actual measurement values in the prediction period by the total of the prediction values in the prediction period (step T2).

図20を参照して、イベントの影響度の算出結の一例について説明する。同図は、予測値と実測値とを示す折れ線グラフである。同図における実線は、実際に集計されたブログの書き込み数をプロットしたものである。一点鎖線は、予測値をプロットしたものである。「P1」の時期はイベントの開始時期である。斜線部分は、予測値と実測値との間の差分を示す部分である。   With reference to FIG. 20, an example of the calculation result of the event influence level will be described. The figure is a line graph showing predicted values and actual measured values. The solid line in the figure is a plot of the number of blog writes actually tabulated. The alternate long and short dash line plots the predicted values. The “P1” time is the start time of the event. The hatched portion is a portion indicating a difference between the predicted value and the actually measured value.

図20に示すように、イベントの開始時期「P1」から、予測期間内において、予測値に対し、実際のブログ書き込み数が増加している。この増加分がイベントの影響により増加した書き込み数と推測される。   As shown in FIG. 20, from the event start time “P1”, the actual number of blog writes increases with respect to the predicted value within the prediction period. This increase is estimated to be the number of writes increased due to the event.

なお、本実施形態では、分析・可視化サーバ20は、実測値の合計を予測値の合計で除算した値を影響度としているが、予測値に対する実測値の増減の度合を示す値であれば、他の方法で影響度を算出してもよい。例えば、予測期間内のある日付における実測値と予測値との間の差分自体を影響度としてもよい。   In the present embodiment, the analysis / visualization server 20 uses the value obtained by dividing the total of the actual measurement values by the total of the prediction values as the degree of influence. The degree of influence may be calculated by other methods. For example, the difference itself between the actually measured value and the predicted value on a certain date within the prediction period may be used as the degree of influence.

以上説明したように、本実施形態によれば、分析・可視化サーバ20は、イベントの効果を定量的に測定することができる。   As described above, according to the present embodiment, the analysis / visualization server 20 can quantitatively measure the effect of the event.

(第3の実施形態)
本発明の第3の実施形態について説明する。本実施形態の時系列分析システムは、成長度スコアを更に算出できる点で、第1の実施形態の時系列分析システムと異なる。なお、本実施形態の時系列分析システムについて、図1〜図16で説明した構成と同様な構成の詳細な説明を省略し、第1の実施形態と異なる点について詳しく説明する。
(Third embodiment)
A third embodiment of the present invention will be described. The time series analysis system of this embodiment is different from the time series analysis system of the first embodiment in that a growth score can be further calculated. In addition, about the time series analysis system of this embodiment, the detailed description of the structure similar to the structure demonstrated in FIGS. 1-16 is abbreviate | omitted, and a different point from 1st Embodiment is demonstrated in detail.

本実施形態の利用者PC10は、時系列分析要求データの他、成長度スコアの算出を要求する成長度スコア算出要求データの入力を受け付ける。   The user PC 10 of this embodiment accepts input of growth score calculation request data for requesting calculation of a growth score in addition to time series analysis request data.

成長度スコアとは、ある時期を教師データ期間の終日として算出された予測値に対する、それ以降の時期を教師データ期間の終日として算出された予測値の増減の度合を示す値である。例えば、教師データ期間の終日が遅い方の予測値の合計を、教師データ期間の終日が早い方の予測値の合計で除算した値を成長度スコアとする。   The growth degree score is a value indicating the degree of increase or decrease of the predicted value calculated with the time after that as the all day of the teacher data period with respect to the predicted value calculated with the certain period as the all day of the teacher data period. For example, the growth score is obtained by dividing the sum of the predicted values for the later day of the teacher data period by the sum of the predicted values for the earlier day of the teacher data period.

分析・可視化サーバ20は、成長度スコア算出要求データに基づいて、成長度スコアを算出する。   The analysis / visualization server 20 calculates the growth score based on the growth score calculation request data.

ここでは、最後にブログ書き込み数が集計された日付を「現在」とする。利用者は、「比較対象時期」として、その現在以前の日付を設定する。利用者は、現在を基準として現在以降の所定期間を予測期間に設定し、現在以前の所定期間を教師データ期間に設定する。   Here, the date when the number of blog writes at the end is counted is “present”. The user sets the date before the current time as the “comparison target time”. The user sets a predetermined period after the present as the prediction period based on the present, and sets a predetermined period before the present as the teacher data period.

例えば、利用者は、現在より1週間前の日付を比較対象時期に設定し、現在以降の2カ月間を予測期間に設定し、現在以前の1年間を教師データ期間に設定する。   For example, the user sets the date one week before the current time as the comparison target time, sets the two months after the current time as the prediction period, and sets the previous year as the teacher data period.

利用者PC10は、比較対象時期、予測期間、および教師データ期間を示す情報を含む成長度スコア算出要求データを分析・可視化サーバ20へ出力する。   The user PC 10 outputs growth score calculation request data including information indicating the comparison target time, the prediction period, and the teacher data period to the analysis / visualization server 20.

図21は、成長度スコア算出要求データに含まれる情報を示す図である。同図を参照すると、影響度分析要求データには、「カテゴリ」、「キーワード」、「教師データ期間」、「予測期間」、および「比較対象時期」を示す情報を含む。   FIG. 21 is a diagram illustrating information included in the growth score calculation request data. Referring to the figure, the impact analysis request data includes information indicating “category”, “keyword”, “teacher data period”, “prediction period”, and “comparison target time”.

「カテゴリ」、「キーワード」は、第1の実施形態と同様である。「教師データ期間」、「予測期間」は、現在を基準に設定された教師データ期間、予測期間である。「比較対象時期」は、現在以前の所定の日付である。   “Category” and “Keyword” are the same as those in the first embodiment. “Teacher data period” and “prediction period” are a teacher data period and a prediction period set based on the current time. The “comparison time” is a predetermined date before the present time.

図22は、本実施形態の分析・可視化サーバ20の動作を示すフローチャートである。この動作は、分析・可視化サーバ20が成長度スコア算出要求データを受信したときに開始する。   FIG. 22 is a flowchart showing the operation of the analysis / visualization server 20 of this embodiment. This operation starts when the analysis / visualization server 20 receives the growth score calculation request data.

分析・可視化サーバ20は、成長度スコア算出要求データの示す、現在を基準とした「教師データ期間」、「予測期間」を設定する(ステップT3)。   The analysis / visualization server 20 sets a “teacher data period” and a “prediction period” based on the current time indicated by the growth score calculation request data (step T3).

分析・可視化サーバ20は、教師データ期間のブログ書き込み数の集計結果から、予測期間における予測値を算出するための時系列分析処理を実行する(ステップT4)。図22における時系列分析処理は、図8に示した時系列分析処理と同様の処理である。   The analysis / visualization server 20 executes a time series analysis process for calculating a predicted value in the prediction period from the result of counting the number of blog writes in the teacher data period (step T4). The time series analysis process in FIG. 22 is the same process as the time series analysis process shown in FIG.

次いで、分析・可視化サーバ20は、成長度スコア算出要求データの示す「教師データ期間」の長さは変えずに、その終日が「比較対象時期」になるように、「教師データ期間」を設定し直す。   Next, the analysis / visualization server 20 sets the “teacher data period” so that the entire day becomes the “comparison time” without changing the length of the “teacher data period” indicated by the growth score calculation request data. Try again.

また、分析・可視化サーバ20は、成長度スコア算出要求データの示す「予測期間」の長さは変えずに、その初日が「比較対象時期」になるように、「予測期間」を設定し直す。   Also, the analysis / visualization server 20 resets the “prediction period” so that the first day becomes the “comparison period” without changing the length of the “prediction period” indicated by the growth score calculation request data. .

つまり、分析・可視化サーバ20は、比較対象時期を基準とした教師データ期間、予測期間を設定する(ステップT5)。   That is, the analysis / visualization server 20 sets a teacher data period and a prediction period based on the comparison target time (step T5).

分析・可視化サーバ20は、新たに設定された教師データ期間、予測期間に基づいて、時系列分析処理を実行する(ステップT6)。   The analysis / visualization server 20 executes time series analysis processing based on the newly set teacher data period and prediction period (step T6).

分析・可視化サーバ20は、現在を基準として算出された予測期間内の予測値の合計を、比較対象時期を基準として算出された予測期間内の予測値の合計で除算することにより、成長度スコアを算出する(ステップT7)。ステップT7の後、分析・可視化サーバ20は、動作を終了する。   The analysis / visualization server 20 divides the total of the predicted values within the prediction period calculated based on the current time by the total of the predicted values within the prediction period calculated based on the comparison target time, thereby obtaining a growth score. Is calculated (step T7). After step T7, the analysis / visualization server 20 ends the operation.

図23を参照して、成長度スコアの算出結の一例について説明する。同図は、現在、比較対象時期のそれぞれを基準として算出された予測値をプロットした折れ線グラフである。同図における細い実線は、現在を基準とした教師データ期間の集計結果の一部をプロットしたものである。太い実線は、現在を基準とした予測期間内の予測値をプロットしたものである。一点鎖線は、比較対象時期を基準とした予測期間内の予測値をプロットしたものである。比較対象時期は1週間前に設定されたものとする。   With reference to FIG. 23, an example of the calculation result of the growth degree score will be described. This figure is a line graph in which the predicted values calculated based on the respective comparison target periods are plotted. The thin solid line in the figure plots a part of the total result of the teacher data period based on the present. The thick solid line is a plot of the predicted value within the prediction period based on the current time. The alternate long and short dash line plots the predicted values within the prediction period with the comparison target time as a reference. The comparison target time is set one week ago.

図23に示すように、1週間前を基準として算出された予測値よりも、現在を基準として算出された予測値は増加している。この予測値の増加率が成長度スコアとして算出される。   As shown in FIG. 23, the predicted value calculated on the basis of the present is higher than the predicted value calculated on the basis of one week ago. An increase rate of the predicted value is calculated as a growth score.

なお、本実施形態では、分析・可視化サーバ20は、現在を基準として算出された予測期間内の予測値の合計を、比較対象時期を基準として算出された予測期間内の予測値の合計で除算することにより、成長度スコアを算出している。   In the present embodiment, the analysis / visualization server 20 divides the total of the prediction values within the prediction period calculated based on the current time by the total of the prediction values within the prediction period calculated based on the comparison target time. By doing so, the growth score is calculated.

しかし、過去の時点の予測値に対する、それ以降における予測値の増減の度合を示す値であれば、他の算出方法で算出した値を成長度スコアとしてもよい。例えば、分析・可視化サーバ20は、現在を基準として算出された予測期間内の予測値の合計と、比較対象時期を基準として算出された予測期間内の予測値の合計との差分を成長度スコアとしてもよい。   However, as long as the value indicates the degree of increase / decrease in the predicted value thereafter with respect to the predicted value at the past time point, the value calculated by another calculation method may be used as the growth score. For example, the analysis / visualization server 20 calculates the difference between the total of the predicted values within the prediction period calculated based on the current time and the total of the predicted values within the prediction period calculated based on the comparison target time as a growth score. It is good.

また、本実施形態では、比較対象時期を1つだけ設定しているが、複数設定してもよいのは勿論である。例えば、分析・可視化サーバ20は、現在、その1週間前、1カ月前の3つの時点が設定されたとき、1週間前に対する現在の成長度、1カ月前に対する現在の成長度を算出する。   In this embodiment, only one comparison target time is set, but it is needless to say that a plurality of times may be set. For example, the analysis / visualization server 20 calculates the current growth degree for one week ago and the current growth degree for one month ago when three time points one week ago and one month ago are set.

以上説明したように、本実施形態によれば、過去の予測値と、それ以降の予測値との差を成長度として定量化することができる。   As described above, according to the present embodiment, the difference between the past predicted value and the predicted value thereafter can be quantified as the degree of growth.

(第4の実施形態)
本発明の第4の実施形態について説明する。本実施形態の時系列分析システムは、イベントの効果を更に予測できる点で、第2の実施形態の時系列分析システムと異なる。なお、本実施形態の時系列分析システムについて、図17〜図20で説明した構成と同様な構成の詳細な説明を省略し、第2の実施形態と異なる点について詳しく説明する。
(Fourth embodiment)
A fourth embodiment of the present invention will be described. The time series analysis system of this embodiment is different from the time series analysis system of the second embodiment in that the effect of an event can be further predicted. In addition, about the time series analysis system of this embodiment, the detailed description of the structure similar to the structure demonstrated in FIGS. 17-20 is abbreviate | omitted, and a different point from 2nd Embodiment is demonstrated in detail.

本実施形態の利用者PC10は、時系列分析要求データの他、イベントの効果の予測を要求するシミュレーション要求データの入力を受け付ける。   The user PC 10 of this embodiment accepts input of simulation request data for requesting prediction of the effect of an event in addition to time series analysis request data.

利用者は、カテゴリ、キーワード、イベントの種類、イベントの開始時期、および予測期間を設定する。利用者PC10は、これらを示す情報を含むシミュレーション要求データを送信する。   The user sets the category, keyword, event type, event start time, and prediction period. The user PC 10 transmits simulation request data including information indicating these.

分析・可視化サーバ20は、予測パラメータDB40に格納されたデータの中から、シミュレーション要求データの示すカテゴリと同一カテゴリに属し、類似するイベントを検索する。類似するイベントとは、キーワードの一部または全部が一致し、イベント種類が同じイベントである。分析・可視化サーバ20は、検索したイベントの予測式の成分を読み出す。また、分析・可視化サーバ20は、ブログDB30のブログデータから、検索したイベントのイベント開始時期以降の実測値を取得する。   The analysis / visualization server 20 searches the data stored in the prediction parameter DB 40 for events that belong to the same category as the category indicated by the simulation request data and are similar. Similar events are events in which some or all of the keywords match and the event type is the same. The analysis / visualization server 20 reads the component of the predicted expression of the searched event. Further, the analysis / visualization server 20 acquires the actual measurement values after the event start time of the searched event from the blog data of the blog DB 30.

分析・可視化サーバ20は、予測式から算出された予測値と、実測値とを表示するためのデータを利用者PC10へ送信する。   The analysis / visualization server 20 transmits data for displaying the predicted value calculated from the prediction formula and the actual measurement value to the user PC 10.

図24はシミュレーション要求データに含まれる情報を示す図である。同図を参照すると、シミュレーション要求データには、「カテゴリ」、「キーワード」、「イベント種類」、「イベント開始時期」、および「予測期間」を示す情報を含む。「カテゴリ」、「キーワード」、「イベント種類」、「イベント開始時期」、および「予測期間」の内容は、第2の実施形態と同様である。   FIG. 24 is a diagram showing information included in the simulation request data. Referring to the figure, the simulation request data includes information indicating “category”, “keyword”, “event type”, “event start time”, and “prediction period”. The contents of “category”, “keyword”, “event type”, “event start time”, and “prediction period” are the same as those in the second embodiment.

図25は、本実施形態の分析・可視化サーバ20の実行するイベント効果予測処理を示すフローチャートである。イベント効果予測処理は、分析・可視化サーバ20がシミュレーション要求データを受信したときに開始する。   FIG. 25 is a flowchart showing event effect prediction processing executed by the analysis / visualization server 20 of this embodiment. The event effect prediction process starts when the analysis / visualization server 20 receives simulation request data.

分析・可視化サーバ20は、シミュレーション要求データの示すカテゴリと同一カテゴリに属し、類似するイベントを検索する。分析・可視化サーバ20は、検索したイベントの予測式の成分を読み出す。複数のイベントが検索された場合、それらのイベントの成分の平均値を算出する(ステップT11)。   The analysis / visualization server 20 searches for similar events that belong to the same category as the category indicated by the simulation request data. The analysis / visualization server 20 reads the component of the predicted expression of the searched event. When a plurality of events are searched, the average value of the components of those events is calculated (step T11).

分析・可視化サーバ20は、取得した成分から得た予測式で、シミュレーション要求データの示す予測期間における予測値を算出する(ステップT12)。   The analysis / visualization server 20 calculates a predicted value in the prediction period indicated by the simulation request data using a prediction formula obtained from the acquired component (step T12).

分析・可視化サーバ20は、ブログDB30から、検索したイベントのブログデータを読み出し、そのイベントの開始時期以降のブログ書き込み数の実測値を集計する。複数のイベントが検索された場合、それらのイベントの実測値の平均値を算出する。分析・可視化サーバ20は、イベント開始時期から、シミュレーション要求データの示す予測期間と同じ長さの期間が経過するまでの期間について集計する。   The analysis / visualization server 20 reads the blog data of the searched event from the blog DB 30, and totals the measured values of the number of blog writes after the start time of the event. When a plurality of events are searched, an average value of actually measured values of those events is calculated. The analysis / visualization server 20 totals the period from the event start time until the period of the same length as the prediction period indicated by the simulation request data elapses.

分析・可視化サーバ20は、予測値と実測値とを表示するためのデータを利用者PC10へ送信する(ステップT13)。ステップT13の後、分析・可視化サーバ20は、イベント効果予測処理を終了する。   The analysis / visualization server 20 transmits data for displaying the predicted value and the actual measurement value to the user PC 10 (step T13). After step T13, the analysis / visualization server 20 ends the event effect prediction process.

以上説明したように、分析・可視化サーバ20は、過去の類似イベントの予測値と、実測値とを求めるので、イベントを実行した場合の効果をシミュレートできる。   As described above, the analysis / visualization server 20 obtains the predicted value and the actual measurement value of the past similar event, and therefore can simulate the effect when the event is executed.

1 時系列データ分析システム
10 利用者PC
20 分析・可視化サーバ
30 ブログDB
40 予測パラメータDB
201 ブログ抽出・集計部
202 トレンド成分学習部
203 周期成分学習部
204 分析結果作成部
2011 測定部
2012 特異点検出・補正部
1 Time-series data analysis system 10 User PC
20 Analysis / Visualization Server 30 Blog DB
40 Prediction parameter DB
201 Blog extraction / aggregation unit 202 Trend component learning unit 203 Periodic component learning unit 204 Analysis result creation unit 2011 Measurement unit 2012 Singularity detection / correction unit

Claims (27)

Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手段と、
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手段と、
前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手段と、
前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正する補正手段を有し、
前記トレンドパラメータ算出手段は、前記補正手段により外れ値が検出された場合、該補正手段により該外れ値が補正された前記時系列値から前記トレンドパラメータを算出し、
前記補正手段は、前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をy t 、自然数をm、該バースト期間におけるバースト値をBURSTとして、
Figure 0005077711
Figure 0005077711
Figure 0005077711
の式により各バースト期間のバースト値を算出し、該バースト値の絶対値が高い順に所定個のバースト期間を抽出し、抽出した該バースト期間内の時系列値を外れ値として補正する、時系列分析装置。
A function that represents an increase / decrease characteristic peculiar to Web-related data, a function whose parameter is undetermined is defined in advance as a trend function, and the parameter of the trend function is based on the time-series values of Web-related data aggregated for a specific matter Trend parameter calculation means for calculating as a trend parameter,
Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, A periodic parameter calculating means for calculating the parameter of
By adding the trend function to which the trend parameter calculated by the trend parameter calculation means is applied and the periodic function to which the periodic parameter calculated by the periodic parameter calculation means is added, the particular function A prediction formula calculation means for calculating a prediction formula for predicting the transition of Web-related data;
Among the time series values, there is a correction unit that detects outliers that are suddenly increased or decreased, and corrects the outliers,
When the outlier is detected by the correcting unit, the trend parameter calculating unit calculates the trend parameter from the time series value in which the outlier is corrected by the correcting unit,
In the plurality of burst periods, each of which is a period when the time series values are aggregated, the correction means includes mintime as the first time in each burst period, and the last time in the burst period. Maxtime, α is a positive real number, t is a time when time series values are tabulated, y t is the time series value at time t , m is a natural number, and BURST is a burst value in the burst period.
Figure 0005077711
Figure 0005077711
Figure 0005077711
Calculating a burst value of each burst period by the following formula, extracting a predetermined number of burst periods in descending order of the absolute value of the burst value, and correcting the extracted time series value in the burst period as an outlier Analysis equipment.
前記周期パラメータ算出手段は、周期が異なる複数の周期関数を定義しておき、それぞれの周期関数に対応する複数の周期パラメータを算出する、請求項1に記載の時系列分析装置。   The time series analysis apparatus according to claim 1, wherein the periodic parameter calculation unit defines a plurality of periodic functions having different periods and calculates a plurality of periodic parameters corresponding to the respective periodic functions. 前記補正手段は、前記バースト期間の長さを、最小値から最大値まで変化させて、各バースト値を算出する、請求項1または2に記載の時系列分析装置。 The time series analysis apparatus according to claim 1 , wherein the correction unit calculates each burst value by changing a length of the burst period from a minimum value to a maximum value. 前記補正手段は、バースト値の絶対値が高いバースト期間を優先して順に抽出し、既に抽出したバースト期間と時期が重複するバースト期間は抽出しない、請求項3に記載の時系列分析装置。 The time series analysis apparatus according to claim 3 , wherein the correcting unit preferentially extracts burst periods having a high absolute value of burst values in order, and does not extract burst periods that overlap with the already extracted burst periods. 時系列値の値を予測すべき予測時期が入力されたとき、前記予測式算出手段により算出された前記予測式に、該予測時期を代入することにより、該予測時期における時系列値を予測値として算出する予測値算出手段を更に有する、請求項1乃至4のいずれか1項に記載の時系列分析装置。 When a prediction time for predicting the value of the time series value is input, the time series value at the prediction time is converted into a prediction value by substituting the prediction time into the prediction formula calculated by the prediction formula calculation means. The time series analysis apparatus according to claim 1 , further comprising: a predicted value calculation unit that calculates as follows. Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手段と、
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手段と、
前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手段と、
時系列値の値を予測すべき予測時期が入力されたとき、前記予測式算出手段により算出された前記予測式に、該予測時期を代入することにより、該予測時期における時系列値を予測値として算出する予測値算出手段と、
イベントが開催された時期から所定の期間が経過するまでに集計された時系列値と、前記予測値算出手段により該期間内で算出された予測値とに基づいて該イベントの影響度を算出する影響度算出手段とを有する時系列分析装置。
A function that represents an increase / decrease characteristic peculiar to Web-related data, a function whose parameter is undetermined is defined in advance as a trend function, and the parameter of the trend function is based on the time-series values of Web-related data aggregated for a specific matter Trend parameter calculation means for calculating as a trend parameter,
Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, A periodic parameter calculating means for calculating the parameter of
By adding the trend function to which the trend parameter calculated by the trend parameter calculation means is applied and the periodic function to which the periodic parameter calculated by the periodic parameter calculation means is added, the particular function A prediction formula calculation means for calculating a prediction formula for predicting the transition of Web-related data;
When a prediction time for predicting the value of the time series value is input, the time series value at the prediction time is converted into a prediction value by substituting the prediction time into the prediction formula calculated by the prediction formula calculation means. Predicted value calculation means for calculating as
The degree of influence of the event is calculated on the basis of the time-series values collected from the time when the event is held until the predetermined period elapses and the predicted value calculated within the period by the predicted value calculation means. A time-series analysis apparatus having an influence degree calculation means.
前記周期パラメータ算出手段は、周期が異なる複数の周期関数を定義しておき、それぞれの周期関数に対応する複数の周期パラメータを算出する、請求項6に記載の時系列分析装置。 The time series analysis apparatus according to claim 6 , wherein the periodic parameter calculation unit defines a plurality of periodic functions having different periods and calculates a plurality of periodic parameters corresponding to the respective periodic functions. 前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正する補正手段を更に有し、
前記トレンドパラメータ算出手段は、前記補正手段により外れ値が検出された場合、該補正手段により該外れ値が補正された前記時系列値から前記トレンドパラメータを算出する、請求項6又は7に記載の時系列分析装置。
Among the time series values, it further includes a correcting unit that detects an outlier that is a value that suddenly increases or decreases, and corrects the outlier.
8. The trend parameter calculation unit according to claim 6 , wherein, when an outlier is detected by the correction unit, the trend parameter calculation unit calculates the trend parameter from the time-series value in which the outlier is corrected by the correction unit. Time series analyzer.
前記補正手段は、前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をyt、自然数をm、該バースト期間におけるバースト値をBURSTとして、
Figure 0005077711
Figure 0005077711
Figure 0005077711
の式により各バースト期間のバースト値を算出し、該バースト値の絶対値が高い順に所定個のバースト期間を抽出し、抽出した該バースト期間内の時系列値を外れ値として補正する、請求項8に記載の時系列分析装置。
In the plurality of burst periods, each of which is a period when the time series values are aggregated, the correction means includes mintime as the first time in each burst period, and the last time in the burst period. Maxtime, α is a positive real number, t is a time when time series values are tabulated, y t is the time series value at time t, m is a natural number, and BURST is a burst value in the burst period.
Figure 0005077711
Figure 0005077711
Figure 0005077711
Calculates a burst value for each burst period by the formula, extracting a predetermined number of burst periods absolute value in descending order of the burst value, corrects the series values as outliers when in extracted the burst period, claim 8. The time series analysis apparatus according to 8 .
前記補正手段は、前記バースト期間の長さを、最小値から最大値まで変化させて、各バースト値を算出する、請求項9に記載の時系列分析装置。 The time series analyzer according to claim 9 , wherein the correction unit calculates each burst value by changing a length of the burst period from a minimum value to a maximum value. 前記補正手段は、バースト値の絶対値が高いバースト期間を優先して順に抽出し、既に抽出したバースト期間と時期が重複するバースト期間は抽出しない、請求項10に記載の時系列分析装置。 The time series analysis apparatus according to claim 10 , wherein the correction unit extracts burst periods with a high absolute value of the burst value in priority order, and does not extract burst periods that overlap with the already extracted burst periods. Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手段と、
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手段と、
前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手段と、
時系列値の値を予測すべき予測時期が入力されたとき、前記予測式算出手段により算出された前記予測式に、該予測時期を代入することにより、該予測時期における時系列値を予測値として算出する予測値算出手段と、を有し、
前記予測値算出手段は、第1の集計期間と、第2の集計期間と、予測時期とが入力されたとき、該第1の集計期間内に集計された時系列値に基づいて第1の予測式を算出し、該第2の集計期間内に集計された時系列値に基づいて第2の予測式を算出し、該第1の予測式に該予測時期を代入して得た予測値に対する、該第2の予測式に該予測時期を代入して得た予測値の度合を成長度として算出する、時系列分析装置。
A function that represents an increase / decrease characteristic peculiar to Web-related data, a function whose parameter is undetermined is defined in advance as a trend function, and the parameter of the trend function is based on the time-series values of Web-related data aggregated for a specific matter Trend parameter calculation means for calculating as a trend parameter,
Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, A periodic parameter calculating means for calculating the parameter of
By adding the trend function to which the trend parameter calculated by the trend parameter calculation means is applied and the periodic function to which the periodic parameter calculated by the periodic parameter calculation means is added, the particular function A prediction formula calculation means for calculating a prediction formula for predicting the transition of Web-related data;
When a prediction time for predicting the value of the time series value is input, the time series value at the prediction time is converted into a prediction value by substituting the prediction time into the prediction formula calculated by the prediction formula calculation means. Predictive value calculation means for calculating as
The predicted value calculation means is configured to input a first aggregation period, a second aggregation period, and a prediction time based on a time series value aggregated within the first aggregation period when a prediction period is input. A prediction value obtained by calculating a prediction formula, calculating a second prediction formula based on the time series values aggregated within the second aggregation period, and substituting the prediction timing into the first prediction formula for, we calculate the degree of the predicted value obtained by substituting the predicted time to the prediction equation of the second as growth degree, time series analysis apparatus.
前記周期パラメータ算出手段は、周期が異なる複数の周期関数を定義しておき、それぞれの周期関数に対応する複数の周期パラメータを算出する、請求項12に記載の時系列分析装置。 The time series analysis apparatus according to claim 12 , wherein the periodic parameter calculation unit defines a plurality of periodic functions having different periods and calculates a plurality of periodic parameters corresponding to the respective periodic functions. 前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正する補正手段を更に有し、
前記トレンドパラメータ算出手段は、前記補正手段により外れ値が検出された場合、該補正手段により該外れ値が補正された前記時系列値から前記トレンドパラメータを算出する、請求項12又は13に記載の時系列分析装置。
Among the time series values, it further includes a correcting unit that detects an outlier that is a value that suddenly increases or decreases, and corrects the outlier.
14. The trend parameter calculation unit according to claim 12 or 13 , wherein, when an outlier is detected by the correction unit, the trend parameter is calculated from the time series value in which the outlier is corrected by the correction unit. Time series analyzer.
前記補正手段は、前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をyt、自然数をm、該バースト期間におけるバースト値をBURSTとして、
Figure 0005077711
Figure 0005077711
Figure 0005077711
の式により各バースト期間のバースト値を算出し、該バースト値の絶対値が高い順に所定個のバースト期間を抽出し、抽出した該バースト期間内の時系列値を外れ値として補正する、請求項14に記載の時系列分析装置。
In the plurality of burst periods, each of which is a period when the time series values are aggregated, the correction means includes mintime as the first time in each burst period, and the last time in the burst period. Maxtime, α is a positive real number, t is a time when time series values are tabulated, y t is the time series value at time t, m is a natural number, and BURST is a burst value in the burst period.
Figure 0005077711
Figure 0005077711
Figure 0005077711
Calculates a burst value for each burst period by the formula, extracting a predetermined number of burst periods absolute value in descending order of the burst value, corrects the series values as outliers when in extracted the burst period, claim 14. A time-series analysis apparatus according to 14 .
前記補正手段は、前記バースト期間の長さを、最小値から最大値まで変化させて、各バースト値を算出する、請求項15に記載の時系列分析装置。 The time series analysis apparatus according to claim 15 , wherein the correction unit calculates each burst value by changing a length of the burst period from a minimum value to a maximum value. 前記補正手段は、バースト値の絶対値が高いバースト期間を優先して順に抽出し、既に抽出したバースト期間と時期が重複するバースト期間は抽出しない、請求項16に記載の時系列分析装置。 17. The time series analysis apparatus according to claim 16 , wherein the correction unit sequentially extracts burst periods having a high absolute value of the burst value in order, and does not extract a burst period that overlaps with the already extracted burst period. 前記トレンド関数は、対数関数、一次関数、累乗関数、及び指数関数のうち、いずれかの関数である、請求項1乃至17のいずれか1項に記載の時系列分析装置。 The time series analysis apparatus according to claim 1 , wherein the trend function is any one of a logarithmic function, a linear function, a power function, and an exponential function. 前記トレンドパラメータ算出手段は、最小ニ乗法を使用して前記時系列値と、該時系列値が集計された時期をトレンド関数に代入して得た値との差異が最小となる前記トレンドパラメータを算出する、請求項1乃至18のいずれか1項に記載の時系列分析装置。 The trend parameter calculation means uses the least power method to calculate the trend parameter that minimizes the difference between the time series value and a value obtained by substituting the time when the time series value is aggregated into a trend function. The time series analysis apparatus according to claim 1 , wherein the time series analysis apparatus calculates the time series analysis apparatus. 前記周期パラメータ算出手段は、前記減算後の前記時系列値をフーリエ解析することにより、前記周期パラメータを算出する、請求項1乃至19のいずれか1項に記載の時系列分析装置。 The time series analysis apparatus according to claim 1 , wherein the periodic parameter calculation unit calculates the periodic parameter by performing a Fourier analysis on the time series value after the subtraction. 前記周期パラメータ算出手段は、前記減算後の前記時系列値をARモデル解析することにより、前記周期パラメータを算出する、請求項1乃至20のいずれか1項に記載の時系列分析装置。 21. The time series analysis apparatus according to claim 1 , wherein the periodic parameter calculation unit calculates the periodic parameter by performing an AR model analysis on the time series value after the subtraction. Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め保持したトレンドパラメータ算出手段が、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出し、
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め保持した周期パラメータ算出手段が、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出し、
予測式算出手段が、前記トレンドパラメータ算出手段により算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手段により算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出し、
前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正し、
前記トレンドパラメータを算出する際に、前記外れ値が検出された場合、該外れ値が補正された前記時系列値から前記トレンドパラメータを算出し、
前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をy t 、自然数をm、該バースト期間におけるバースト値をBURSTとして、
Figure 0005077711
Figure 0005077711
Figure 0005077711
の式により各バースト期間のバースト値を算出し、該バースト値の絶対値が高い順に所定個のバースト期間を抽出し、抽出した該バースト期間内の時系列値を外れ値として補正する、時系列分析方法。
A trend parameter calculation means that represents a trend of increase / decrease peculiar to Web-related data and previously stores a function whose parameter is undetermined as a trend function is based on the time series value of Web-related data aggregated for a specific matter. Calculate function parameters as trend parameters,
The periodic parameter calculation means that represents the periodicity peculiar to the Web-related data and previously holds a function whose parameter is undetermined as a periodic function is based on the time series value obtained by removing the trend function to which the trend parameter is applied. Calculating the parameters of the periodic function as periodic parameters;
The prediction formula calculation means adds the trend function to which the trend parameter calculated by the trend parameter calculation means is applied and the periodic function to which the periodic parameter calculated by the periodic parameter calculation means is added. , Calculating a prediction formula for predicting the transition of the web-related data related to the specific matter ,
Detecting outliers that are suddenly increased or decreased among the time series values, correcting the outliers,
When calculating the trend parameter, if the outlier is detected, the trend parameter is calculated from the time series value in which the outlier is corrected,
In a plurality of burst periods, each period of which the time series values are aggregated being the first period, the first period in each burst period is mintime, the last period in the burst period is maxtime, and positive The real number is α, the time when the time series values are tabulated, t, the time series value at time t is y t , the natural number is m, and the burst value in the burst period is BURST,
Figure 0005077711
Figure 0005077711
Figure 0005077711
Calculating a burst value of each burst period by the following formula, extracting a predetermined number of burst periods in descending order of the absolute value of the burst value, and correcting the extracted time series value in the burst period as an outlier Analysis method.
Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出し、A function that represents an increase / decrease characteristic peculiar to Web-related data, a function whose parameter is undetermined is defined in advance as a trend function, and the parameter of the trend function is based on the time-series values of Web-related data aggregated for a specific matter As a trend parameter,
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出し、Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, Is calculated as a periodic parameter,
前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出し、By adding the trend function to which the trend parameter is applied and the periodic function to which the periodic parameter is applied, a prediction formula for predicting the transition of Web-related data related to the specific matter is calculated,
時系列値の値を予測すべき予測時期を前記予測式に代入することにより、該予測時期における時系列値を予測値として算出し、By substituting into the prediction formula the prediction time when the value of the time series value should be predicted, the time series value at the prediction time is calculated as the prediction value,
イベントが開催された時期から所定の期間が経過するまでに集計された時系列値と、該期間内で算出された予測値とに基づいて該イベントの影響度を算出する時系列分析方法。A time-series analysis method for calculating an influence degree of an event based on a time-series value totaled until a predetermined period elapses from a time when the event is held and a predicted value calculated within the period.
Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出し、A function that represents an increase / decrease characteristic peculiar to Web-related data, a function whose parameter is undetermined is defined in advance as a trend function, and the parameter of the trend function is based on the time-series values of Web-related data aggregated for a specific matter As a trend parameter,
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出し、Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, Is calculated as a periodic parameter,
前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出し、By adding the trend function to which the trend parameter is applied and the periodic function to which the periodic parameter is applied, a prediction formula for predicting the transition of Web-related data related to the specific matter is calculated,
時系列値の値を予測すべき予測時期を前記予測式に代入することにより、該予測時期における時系列値を予測値として算出する時系列分析方法であって、A time series analysis method for calculating a time series value at a prediction time as a prediction value by substituting a prediction time at which a value of a time series value is to be predicted into the prediction formula,
第1の集計期間内に集計された時系列値に基づいて第1の予測式を算出し、第2の集計期間内に集計された時系列値に基づいて第2の予測式を算出し、第1の予測式に該予測時期を代入して得た予測値に対する、該第2の予測式に該予測時期を代入して得た予測値の度合を成長度として算出する、時系列分析方法。Calculating a first prediction formula based on a time series value aggregated within a first aggregation period, calculating a second prediction formula based on a time series value aggregated within a second aggregation period; A time-series analysis method for calculating a degree of growth of a prediction value obtained by substituting the prediction time into the second prediction formula with respect to a prediction value obtained by substituting the prediction time into the first prediction formula .
コンピュータに、
Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手順、
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手順、及び
前記トレンドパラメータ算出手順で算出された前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータ算出手順で算出された前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手順、
前記時系列値のうち、突発的に増減した値である外れ値を検出し、該外れ値を補正する補正手順、
を実行させ、
前記トレンドパラメータ算出手順では、前記補正手順により外れ値が検出された場合、該補正手順により該外れ値が補正された前記時系列値から前記トレンドパラメータを算出し、
前記補正手順では、前記時系列値が集計された期間の各時期を最初の時期とする複数のバースト期間において、それぞれの該バースト期間内の最初の時期をmintime、該バースト期間内の最後の時期をmaxtime、正の実数をα、時系列値を集計した時期をt、時期tにおける前記時系列値をy t 、自然数をm、該バースト期間におけるバースト値をBURSTとして、
Figure 0005077711
Figure 0005077711
Figure 0005077711
の式により各バースト期間のバースト値を算出し、該バースト値の絶対値が高い順に所定個のバースト期間を抽出し、抽出した該バースト期間内の時系列値を外れ値として補正するプログラム。
On the computer,
A function that represents an increase / decrease characteristic peculiar to Web-related data, a function whose parameter is undetermined is defined in advance as a trend function, and the parameter of the trend function is based on the time-series values of Web-related data aggregated for a specific matter Trend parameter calculation procedure to calculate as a trend parameter,
Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, A periodic parameter calculation procedure for calculating the parameter of the above as a periodic parameter, the trend function to which the trend parameter calculated by the trend parameter calculation procedure is applied, and the periodic parameter calculated by the periodic parameter calculation procedure is applied. A prediction formula calculation procedure for calculating a prediction formula for predicting a transition of Web-related data related to the specific matter by adding a periodic function;
A correction procedure for detecting outliers that are suddenly increased or decreased among the time series values and correcting the outliers,
And execute
In the trend parameter calculation procedure, when an outlier is detected by the correction procedure, the trend parameter is calculated from the time series value in which the outlier is corrected by the correction procedure,
In the correction procedure, in a plurality of burst periods in which each period of the time series values is counted as the first period, the first period in each burst period is mintime, and the last period in the burst period Maxtime, α is a positive real number, t is a time when time series values are tabulated, y t is the time series value at time t , m is a natural number, and BURST is a burst value in the burst period.
Figure 0005077711
Figure 0005077711
Figure 0005077711
A program for calculating a burst value of each burst period by the following formula, extracting a predetermined number of burst periods in descending order of the absolute value of the burst value, and correcting the extracted time-series values within the burst period as outliers .
コンピュータに、On the computer,
Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手順、A function that represents an increase / decrease characteristic peculiar to Web-related data, a function whose parameter is undetermined is defined in advance as a trend function, and the parameter of the trend function is based on the time-series values of Web-related data aggregated for a specific matter Trend parameter calculation procedure to calculate as a trend parameter,
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手順、Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, A periodic parameter calculation procedure for calculating the parameter of as a periodic parameter,
前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手順、A prediction formula for calculating a prediction formula for predicting a transition of Web-related data related to the specific matter by adding the trend function to which the trend parameter is applied and the periodic function to which the periodic parameter is applied Calculation procedure,
時系列値の値を予測すべき予測時期を前記予測式に代入することにより、該予測時期における時系列値を予測値として算出する予測値算出手順、A prediction value calculation procedure for calculating a time series value at the prediction time as a prediction value by substituting a prediction time at which the value of the time series value is to be predicted into the prediction formula;
イベントが開催された時期から所定の期間が経過するまでに集計された時系列値と、該期間内で算出された予測値とに基づいて該イベントの影響度を算出する影響度算出手順、を実行させるプログラム。An influence calculation procedure for calculating the influence degree of the event based on the time-series values collected until the predetermined period elapses from the time when the event was held and the predicted value calculated within the period; The program to be executed.
コンピュータに、On the computer,
Web関係のデータに特有の増減傾向を表し、パラメータが未定の関数をトレンド関数として予め定義しておき、特定の事柄について集計されたWeb関係のデータの時系列値に基づいて該トレンド関数のパラメータをトレンドパラメータとして算出するトレンドパラメータ算出手順、A function that represents an increase / decrease characteristic peculiar to Web-related data, a function whose parameter is undetermined is defined in advance as a trend function, and the parameter of the trend function is based on the time-series values of Web-related data aggregated for a specific matter Trend parameter calculation procedure to calculate as a trend parameter,
Web関係のデータに特有の周期性を表し、パラメータが未定の関数を周期関数として予め定義しておき、前記トレンドパラメータを適用した前記トレンド関数を除去した前記時系列値に基づいて、該周期関数のパラメータを周期パラメータとして算出する周期パラメータ算出手順、Based on the time series value representing the periodicity peculiar to Web-related data, defining a function whose parameter is undetermined in advance as a periodic function, and removing the trend function to which the trend parameter is applied, A periodic parameter calculation procedure for calculating the parameter of as a periodic parameter,
前記トレンドパラメータを適用した前記トレンド関数と、前記周期パラメータを適用した前記周期関数とを加算することにより、前記特定の事柄に関するWeb関係のデータの推移を予測するための予測式を算出する予測式算出手順、A prediction formula for calculating a prediction formula for predicting a transition of Web-related data related to the specific matter by adding the trend function to which the trend parameter is applied and the periodic function to which the periodic parameter is applied Calculation procedure,
時系列値の値を予測すべき予測時期を前記予測式に代入することにより、該予測時期における時系列値を予測値として算出する予測値算出手順、を実行させ、By substituting the prediction time when the value of the time series value should be predicted into the prediction formula, a prediction value calculation procedure for calculating the time series value at the prediction time as a prediction value is executed,
予測値算出手順では、第1の集計期間内に集計された時系列値に基づいて第1の予測式を算出し、第2の集計期間内に集計された時系列値に基づいて第2の予測式を算出したとき、第1の予測式に該予測時期を代入して得た予測値に対する、該第2の予測式に該予測時期を代入して得た予測値の度合を成長度として算出するプログラム。In the predicted value calculation procedure, the first prediction formula is calculated based on the time series values aggregated within the first aggregation period, and the second prediction value is calculated based on the time series values aggregated within the second aggregation period. When the prediction formula is calculated, the degree of growth is the degree of the prediction value obtained by substituting the prediction time into the second prediction formula with respect to the prediction value obtained by substituting the prediction time into the first prediction formula. The program to calculate.
JP2009231488A 2009-10-05 2009-10-05 Time series analysis apparatus, time series analysis method, and program Active JP5077711B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009231488A JP5077711B2 (en) 2009-10-05 2009-10-05 Time series analysis apparatus, time series analysis method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009231488A JP5077711B2 (en) 2009-10-05 2009-10-05 Time series analysis apparatus, time series analysis method, and program

Publications (2)

Publication Number Publication Date
JP2011081491A JP2011081491A (en) 2011-04-21
JP5077711B2 true JP5077711B2 (en) 2012-11-21

Family

ID=44075502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009231488A Active JP5077711B2 (en) 2009-10-05 2009-10-05 Time series analysis apparatus, time series analysis method, and program

Country Status (1)

Country Link
JP (1) JP5077711B2 (en)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5657585B2 (en) * 2012-02-14 2015-01-21 日本電信電話株式会社 Vocabulary learning curve parameter estimation apparatus, method, and program
JP5604464B2 (en) * 2012-02-14 2014-10-08 日本電信電話株式会社 Vocabulary learning curve parameter estimation apparatus, method, and program
JP5952711B2 (en) * 2012-10-24 2016-07-13 Kddi株式会社 Prediction server, program and method for predicting future number of comments in prediction target content
US9317812B2 (en) * 2012-11-30 2016-04-19 Facebook, Inc. Customized predictors for user actions in an online system
JP5952756B2 (en) * 2013-02-26 2016-07-13 Kddi株式会社 Prediction server, program and method for predicting future number of comments in prediction target content
JP6018024B2 (en) * 2013-06-26 2016-11-02 日本電信電話株式会社 CHANGE DETECTION DEVICE, CHANGE DETECTION SYSTEM, CHANGE DETECTION METHOD, AND PROGRAM
JP2015011690A (en) * 2013-07-02 2015-01-19 ニフティ株式会社 Effect measurement program, method, and device
JP5841108B2 (en) * 2013-09-24 2016-01-13 ビッグローブ株式会社 Information processing apparatus, article information generation method and program
JP5622969B1 (en) * 2014-02-04 2014-11-12 株式会社Ubic Document analysis system, document analysis method, and document analysis program
JP5627820B1 (en) * 2014-02-04 2014-11-19 株式会社Ubic Document analysis system, document analysis method, and document analysis program
WO2015118619A1 (en) * 2014-02-04 2015-08-13 株式会社Ubic Document analysis system, document analysis method, and document analysis program
JP6638351B2 (en) * 2015-11-27 2020-01-29 富士通株式会社 Analysis method, analysis program, analysis device, information display method, information display program, and information display device
KR101924352B1 (en) * 2017-04-19 2019-02-20 아시아나아이디티 주식회사 Method for detecting issue based on trend analysis device thereof
JP2019153115A (en) * 2018-03-05 2019-09-12 東京瓦斯株式会社 Gas data remote processing system, program and method
KR101927872B1 (en) * 2018-06-18 2018-12-12 현대멀티캡 주식회사 Power saving computer using usage monitoring and core parking
CN109933607B (en) * 2019-01-25 2023-10-03 微诺时代(北京)科技股份有限公司 Periodic time series data processing method
JP6923864B1 (en) * 2019-12-06 2021-08-25 Arithmer株式会社 Status judgment system, status judgment method and status judgment program
CN113837503B (en) * 2021-11-29 2022-03-29 新风光电子科技股份有限公司 Power grid load prediction method and system based on artificial intelligence
CN117056663B (en) * 2023-10-13 2024-02-13 腾讯科技(深圳)有限公司 Data processing method and device, electronic equipment and storage medium

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003281342A (en) * 2002-03-25 2003-10-03 Nri & Ncc Co Ltd Method and system for analyzing effect of sales measure
JP4185059B2 (en) * 2005-02-18 2008-11-19 大日本印刷株式会社 Trend prediction apparatus and trend prediction method
JP4673727B2 (en) * 2005-11-21 2011-04-20 株式会社リコー Demand forecasting method and demand forecasting program
JP4764864B2 (en) * 2007-11-02 2011-09-07 ヤフー株式会社 Information propagation extracting apparatus and information propagation extracting method

Also Published As

Publication number Publication date
JP2011081491A (en) 2011-04-21

Similar Documents

Publication Publication Date Title
JP5077711B2 (en) Time series analysis apparatus, time series analysis method, and program
JP5963709B2 (en) Computer, prediction method, and prediction program
CN108647891B (en) Data anomaly attribution analysis method and device
Davydenko et al. Measuring forecasting accuracy: The case of judgmental adjustments to SKU-level demand forecasts
US20150142520A1 (en) Crowd-based sentiment indices
JP6848230B2 (en) Processing equipment, processing methods and programs
JP2011141833A (en) Device, method, and program for stock price prediction
Karia et al. Fractionally integrated ARMA for crude palm oil prices prediction: case of potentially overdifference
US8224690B2 (en) Graphical risk-based performance measurement and benchmarking system and method
JP2009244981A (en) Analysis apparatus, analysis method, and analysis program
JP2022143937A (en) Information processing apparatus, information processing method, and information processing program
JP4777941B2 (en) Demand forecasting method and apparatus
JP7235960B2 (en) Job power prediction program, job power prediction method, and job power prediction device
US20130185315A1 (en) Identification of Events of Interest
WO2019205381A1 (en) Stock screening method and device, and computer-readable storage medium
JP6617605B2 (en) Demand amount prediction program, demand amount prediction method, and information processing apparatus
WO2016072474A1 (en) Information processing device, method, and program
EP4050536A1 (en) Analysis device, control method, and program
Donglin et al. Capital-embodied Technological Change and Its Contribution to Economic Growth: 1981-2007∗
Chen et al. Optimum process mean setting based on variable sampling plans with specified consumer’s risk
JP2020071523A (en) Estimation method, charging method, computer, and program
JP2010282580A (en) Apparatus, program, method and system for analyzing life cycle
Gauri A test for suitability of the preliminary samples for constructing control limits of X chart
CN112256974A (en) Public opinion information processing method and device
JP5600127B2 (en) Information aggregation system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120731

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120815

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150907

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5077711

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250