JP2017085417A - データ評価装置、データ評価方法、及びプログラム - Google Patents
データ評価装置、データ評価方法、及びプログラム Download PDFInfo
- Publication number
- JP2017085417A JP2017085417A JP2015213314A JP2015213314A JP2017085417A JP 2017085417 A JP2017085417 A JP 2017085417A JP 2015213314 A JP2015213314 A JP 2015213314A JP 2015213314 A JP2015213314 A JP 2015213314A JP 2017085417 A JP2017085417 A JP 2017085417A
- Authority
- JP
- Japan
- Prior art keywords
- data
- correlation coefficient
- time
- section
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011157 data evaluation Methods 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims description 28
- 238000004364 calculation method Methods 0.000 claims abstract description 24
- 238000011156 evaluation Methods 0.000 claims abstract description 22
- 230000002776 aggregation Effects 0.000 claims description 8
- 238000004220 aggregation Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 13
- 238000013500 data storage Methods 0.000 description 9
- 230000002354 daily effect Effects 0.000 description 8
- 230000003442 weekly effect Effects 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 7
- 238000005259 measurement Methods 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
前記属性に基づいて、前記第1のデータと前記第2のデータのそれぞれを、複数の区間に分割し、前記第1のデータと前記第2のデータにおける同じ区間のデータ間での相関係数を算出する算出手段と、
前記複数の区間における区間毎に得られた相関係数の中で、所定の条件を満たす相関係数を決定し、当該相関係数に対応する区間を選択し、当該区間を示す情報を出力する評価手段と
を備えることを特徴とするデータ評価装置が提供される。
異なるデータソースから得られた第1のデータと第2のデータであって、重複する属性を有する第1のデータと第2のデータを入力する入力ステップと、
前記属性に基づいて、前記第1のデータと前記第2のデータのそれぞれを、複数の区間に分割し、前記第1のデータと前記第2のデータにおける同じ区間のデータ間での相関係数を算出する算出ステップと
前記複数の区間における区間毎に得られた相関係数の中で、所定の条件を満たす相関係数を決定し、当該相関係数に対応する区間を選択し、当該区間を示す情報を出力する評価ステップと
を備えることを特徴とするデータ評価方法が提供される。
図1に、本実施の形態に係るシステムの全体構成図を示す。図1に示すように、本実施の形態におけるシステムは、データ評価装置100、及び複数のデータソースを有する。図1には、例として、複数のデータソースにおけるデータソース1、データソース2が示されている。
図2に、本実施の形態におけるデータ評価装置100の構成例を示す。図2に示すように、データ評価装置100は、入力部101、間隔別時系列データ生成部102、制約付時系列データ生成部103、スコア算出部104、スコア評価部105、出力部106、及びデータ記憶部107を備える。各部の機能の詳細については、各部により実行される処理の内容として後述する。各部の概要は以下のとおりである。
図3は、データ評価装置100が実行する処理の手順を示すフローチャートである。図3に示すフローチャートの手順に沿って、以下、データ評価装置100が実行する処理内容を詳細に説明する。
まず、データ評価装置100の入力部101により、データソース1とデータソース2のそれぞれからデータを入力する。以下、データソース1のデータをDATA1とし、データソース2のデータをDATA2とする。
次に、間隔別時系列データ生成部102が、ステップS101において入力されたDATA1とDATA2のそれぞれについて、間隔別時系列データを生成する。用いる間隔は、例えば、日、週、月等である。つまり、DATA1とDATA2のそれぞれについて、間隔別時系列データとして、日毎、週毎、月毎等の時系列データを生成する。例として、週毎の場合、DATA1における開始時刻から1週間の間のデータの平均値(代表値でもよい)を計算し、以降、1週間毎の平均値を計算し、時系列データとする。DATA2も同様である。
次に、スコア算出部104が、ステップS102で使用した間隔毎に、DATA1の間隔別時系列データとDATA2の間隔別時系列データとを比較する(つまり、相関を計算する)ことにより、相関係数を算出し、これをスコアを算出する。算出されたスコアはデータ記憶部107に格納される。相関の計算については、2つの時系列データ間の相関を算出する一般的な相関関数を使用することができる。算出されたスコア(例えば、−1〜1の値)が大きいほど、比較した時系列データ間の類似性が高いことを示す。
次に、制約付時系列データ生成部103が、入力データから制約付時系列データを生成する。ここでは、データソース1のDATA1とデータソース2のDATA2との間の共通の属性を予め定めておき、当該属性を用いて、DATA1とDATA2のぞれぞれについての制約付時系列データを生成する。例えば、DATA1には35個の属性があり、DATA2には12個の属性があり、共通の属性が3つであるとすれば、当該3つの属性のそれぞれで制約付時系列データを生成することができる。
次に、スコア算出部104が、ステップS104で得られた制約付時系列データ毎に、データソース間での相関を計算して、スコアを算出する。つまり、DATA1ts1c1とDATA2ts1c1との間のスコア、DATA1ts1c2とDATA2ts2c2との間のスコア、....DATA1ts1cmとDATA2ts1cmとの間のスコア、DATA1ts2c1とDATA2ts2c1との間のスコア、......、DATA1tsNcmとDATA2tsNcmとの間のスコアを算出する。相関の計算方法はステップS103での計算方法と同じである。
次に、スコア評価部105が、これまでの処理によりデータ記憶部107に格納されたスコアを評価する。
ステップS107では、出力部106が、ステップS106において出力対象として決定されたスコア、及び、当該スコアが得られた間隔、及びチャンクの情報を出力する。これらに加えて、当該スコアが得られた時系列データを出力してもよい。この場合、例えば、図5〜図8に示した例において、週毎のPM3時〜PM4時のチャンクにおけるスコアが出力対象として決定された場合に、DATA1ts2c16とDATA2ts2c16を出力する。また、この場合、週毎に集約する前のチャンクデータを出力してもよい。なお、入力データや、処理の過程で得られた時系列データ等はデータ記憶部107に格納されているので、ここからデータを読み出すことで出力することができる。ただし、使用しないデータはデータ記憶部107から削除することとしてもよい。
これまでデータソースの数が2である場合について説明したが、これは一例であり、データソースの数は3以上であってもよい。この場合の処理例を以下に説明する。
以上、説明したように、本実施の形態によれば、異なるデータソースから得られた第1のデータと第2のデータであって、重複する属性を有する第1のデータと第2のデータを入力する入力手段と、前記属性に基づいて、前記第1のデータと前記第2のデータのそれぞれを、複数の区間に分割し、前記第1のデータと前記第2のデータにおける同じ区間のデータ間での相関係数を算出する算出手段と、前記複数の区間における区間毎に得られた相関係数の中で、所定の条件を満たす相関係数を決定し、当該相関係数に対応する区間を選択し、当該区間を示す情報を出力する評価手段とを備えるデータ評価装置が提供される。
100 データ評価装置
101 入力部
102 間隔別時系列データ生成部
103 制約付時系列データ生成部
104 スコア算出部
105 スコア評価部
106 出力部
107 データ記憶部
Claims (7)
- 異なるデータソースから得られた第1のデータと第2のデータであって、重複する属性を有する第1のデータと第2のデータを入力する入力手段と、
前記属性に基づいて、前記第1のデータと前記第2のデータのそれぞれを、複数の区間に分割し、前記第1のデータと前記第2のデータにおける同じ区間のデータ間での相関係数を算出する算出手段と、
前記複数の区間における区間毎に得られた相関係数の中で、所定の条件を満たす相関係数を決定し、当該相関係数に対応する区間を選択し、当該区間を示す情報を出力する評価手段と
を備えることを特徴とするデータ評価装置。 - 前記算出手段は、前記第1のデータと前記第2のデータのそれぞれについて、前記複数の区間に分割して得られた各区間に含まれる複数データを所定の期間毎に集約し、集約したデータ間で前記相関係数の算出を行う
ことを特徴とする請求項1に記載のデータ評価装置。 - 前記算出手段は、前記所定の期間として、複数種類の期間を使用し、期間の種類毎に、前記複数の区間における区間毎の相関係数を算出し、
前記評価手段は、前記期間の種類毎かつ前記区間毎に得られた相関係数の中で、所定の条件を満たす相関係数を決定し、当該相関係数に対応する期間の種類及び区間を選択し、当該期間及び区間を示す情報を出力する
ことを特徴とする請求項2に記載のデータ評価装置。 - 前記算出手段は、前記第1のデータと前記第2のデータのそれぞれについて、前記複数の区間に分割せずに、所定の期間毎に集約を行い、集約が行われた第1のデータと集約が行われた第2のデータとの間で相関係数を算出し、
前記評価手段は、前記区間毎に得られた相関係数と、前記集約が行われた第1のデータと前記集約が行われた第2のデータとの間で算出された相関係数の中で、所定の条件を満たす相関係数を決定する
ことを特徴とする請求項1ないし3のうちいずれか1項に記載のデータ評価装置。 - 前記評価手段は、所定の条件を満たす相関係数が得られた区間に対応する部分の前記第1のデータ及び前記第2のデータを出力する
ことを特徴とする請求項1ないし4のうちいずれか1項に記載のデータ評価装置。 - データ評価装置が実行するデータ評価方法であって、
異なるデータソースから得られた第1のデータと第2のデータであって、重複する属性を有する第1のデータと第2のデータを入力する入力ステップと、
前記属性に基づいて、前記第1のデータと前記第2のデータのそれぞれを、複数の区間に分割し、前記第1のデータと前記第2のデータにおける同じ区間のデータ間での相関係数を算出する算出ステップと
前記複数の区間における区間毎に得られた相関係数の中で、所定の条件を満たす相関係数を決定し、当該相関係数に対応する区間を選択し、当該区間を示す情報を出力する評価ステップと
を備えることを特徴とするデータ評価方法。 - コンピュータを、請求項1ないし5のうちいずれか1項に記載のデータ評価装置における各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015213314A JP6595884B2 (ja) | 2015-10-29 | 2015-10-29 | データ評価装置、データ評価方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015213314A JP6595884B2 (ja) | 2015-10-29 | 2015-10-29 | データ評価装置、データ評価方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017085417A true JP2017085417A (ja) | 2017-05-18 |
JP6595884B2 JP6595884B2 (ja) | 2019-10-23 |
Family
ID=58713340
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015213314A Active JP6595884B2 (ja) | 2015-10-29 | 2015-10-29 | データ評価装置、データ評価方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6595884B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001167078A (ja) * | 1999-12-13 | 2001-06-22 | Fuji Electric Co Ltd | ダムまたは河川における流量予測方法 |
JP2008311720A (ja) * | 2007-06-12 | 2008-12-25 | Nippon Telegr & Teleph Corp <Ntt> | 基準値予測方法とシステムおよびプログラム |
WO2015075794A1 (ja) * | 2013-11-20 | 2015-05-28 | 株式会社 東芝 | 電力需要予測システム、電力需要予測方法、需要家プロファイリングシステム、及び需要家プロファイリング方法 |
-
2015
- 2015-10-29 JP JP2015213314A patent/JP6595884B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001167078A (ja) * | 1999-12-13 | 2001-06-22 | Fuji Electric Co Ltd | ダムまたは河川における流量予測方法 |
JP2008311720A (ja) * | 2007-06-12 | 2008-12-25 | Nippon Telegr & Teleph Corp <Ntt> | 基準値予測方法とシステムおよびプログラム |
WO2015075794A1 (ja) * | 2013-11-20 | 2015-05-28 | 株式会社 東芝 | 電力需要予測システム、電力需要予測方法、需要家プロファイリングシステム、及び需要家プロファイリング方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6595884B2 (ja) | 2019-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI718643B (zh) | 異常群體識別方法及裝置 | |
JP4925143B2 (ja) | ストリームデータ処理システム、ストリームデータ処理方法及びストリームデータ処理プログラム | |
US11023577B2 (en) | Anomaly detection for time series data having arbitrary seasonality | |
US10572836B2 (en) | Automatic time interval metadata determination for business intelligence and predictive analytics | |
EP3493109A1 (en) | System and methods for faster processor comparisons of visual graph features | |
US10949593B2 (en) | Model order reduction in transistor level timing | |
US9417981B2 (en) | Data processing system, data processing method, and program | |
US20130027140A1 (en) | Coupling resistance and capacitance analysis systems and methods | |
WO2014045351A1 (ja) | 時系列データ蓄積装置 | |
JP6595884B2 (ja) | データ評価装置、データ評価方法、及びプログラム | |
WO2018171289A1 (zh) | 向数据库存储数据的方法、设备、中间件设备和服务器 | |
US20120158619A1 (en) | Optimal rule set management | |
WO2018044955A1 (en) | Systems and methods for measuring collected content significance | |
US8453101B1 (en) | Method, system and program storage device for generating accurate performance targets for active semiconductor devices during new technology node development | |
Carroll | Detecting variation in chaotic attractors | |
CN108369707B (zh) | 用于提供统计动态仪表数据验证的系统和方法 | |
US9928327B2 (en) | Efficient deployment of table lookup (TLU) in an enterprise-level scalable circuit simulation architecture | |
CN101930369A (zh) | 一种面向任务迁移的组件语义匹配方法 | |
CN112613263B (zh) | 仿真验证方法、装置、电子设备和计算机可读存储介质 | |
JP2010003770A (ja) | 半導体装置の解析及び設計装置、及び半導体装置の解析及び設計方法 | |
CN111026879B (zh) | 多维度价值导向的针对意图的面向对象数值计算方法 | |
Zhang | Asymptotics of sample tail autocorrelations for tail-dependent time series: phase transition and visualization | |
KR20140108017A (ko) | 시퀀스 데이터에서의 패턴 검색 방법 및 장치 | |
US20170004511A1 (en) | Identifying Drivers for a Metric-of-Interest | |
JP7059599B2 (ja) | 検索処理プログラム、検索処理方法および検索処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180725 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190516 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190729 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190927 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6595884 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |