JP5632862B2 - データ検索装置、データ検索方法、及びデータ検索プログラム - Google Patents
データ検索装置、データ検索方法、及びデータ検索プログラム Download PDFInfo
- Publication number
- JP5632862B2 JP5632862B2 JP2012028791A JP2012028791A JP5632862B2 JP 5632862 B2 JP5632862 B2 JP 5632862B2 JP 2012028791 A JP2012028791 A JP 2012028791A JP 2012028791 A JP2012028791 A JP 2012028791A JP 5632862 B2 JP5632862 B2 JP 5632862B2
- Authority
- JP
- Japan
- Prior art keywords
- series data
- time
- similar
- search
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
前記受信部が受信した前記時系列データを記憶する第1メモリと、
前記第1メモリから時系列データを読み出し、所定時間の部分時系列データに分割する区間分割部と、
前記区間分割部が分割した前記部分時系列データについて互いの類似度を求める類似判定部と、
前記類似判定部が求めた前記類似度に基づき、前記区間分割部で生成された部分時系列データの類似検索索引を作成する索引部と、
前記索引部で作成された前記類似検索索引を受信時刻毎にキュー構造で記憶する第2メモリと、
前記区間分割部で生成された前記部分時系列データをクエリとして、指定された閾値よりも類似した部分時系列データを前記類似検索索引を用いて前記第2メモリから読み出す類似ペア検索部と、
を備える。
前記受信部が受信した前記時系列データを記憶する第1メモリと、
前記第1メモリから時系列データを読み出し、所定時間の部分時系列データに分割する区間分割部と、
前記区間分割部が分割した前記部分時系列データについて互いの類似度を求める類似判定部と、
前記部分時系列データを受信時刻で区別可能な構造を有し、前記類似判定部が求めた前記類似度に基づく、前記区間分割部で生成された部分時系列データの類似検索索引を作成する索引部と、
前記索引部で作成された前記類似検索索引を記憶するとともに、前記類似検索索引の構造を維持したまま後続の前記部分時系列データを前記類似検索索引にキューとして追記する第2メモリと、
前記区間分割部で生成された前記部分時系列データをクエリとして、指定された閾値よりも類似した部分時系列データを前記類似検索索引を用いて前記第2メモリから読み出す類似ペア検索部と、
を備える。
図2は、本実施形態のデータ検索装置301を説明する図である。データ検索装置301は、逐次流入してくる複数系列の時系列データを受信する受信部11と、
受信部11が受信した前記時系列データを記憶する第1メモリ12と、
第1メモリ12から時系列データを読み出し、所定時間の部分時系列データに分割する区間分割部13と、
区間分割部13が分割した前記部分時系列データについて互いの類似度を求める類似判定部14と、
類似判定部14が求めた前記類似度に基づき、区間分割部13で生成された部分時系列データの類似検索索引を作成する索引部15と、
索引部15で作成された前記類似検索索引を受信時刻毎にキュー構造で記憶する第2メモリ16と、
区間分割部13で生成された前記部分時系列データをクエリとして、指定された閾値よりも類似した部分時系列データを前記類似検索索引を用いて第2メモリ16から読み出す類似ペア検索部17と、
を備える。
本実施形態における類似検索索引は、距離空間の類似検索索引Vantage Point Tree(VPT)(非特許文献2参照)を採用し、以下の手順で作成する。この索引は、基準となる部分時系列データ(基準部分時系列データ)1つと分割距離1つを定めて、基準部分時系列データからの距離と分割距離に基づいて索引対象の複数の部分時系列データを2つに分類することを繰り返して作成する。ここで、受信時刻tの部分時系列データ集合Stを2分類する例を説明する。基準となる系列pの部分時系列データSp tをStから一つ選び、Stを均等2分割できる距離をrp tとしたとき、Stは、
ステップS104において、類似ペア検索部17は、区間分割部13で分割した最新の受信時刻の部分時系列データをクエリとして、第2メモリ16にキュー構造で管理されている受信時刻ごとの類似検索索引を使って、閾値よりもクエリと類似した部分時系列データを検索する。そして、類似ペア検索部17は、類似部分時系列データペアを出力する。ここでのデータペアとは、最新時刻の部分時系列データとこれに類似する部分時系列データのペアを意味する。類似ペア検索部17は、以下の手順を行い、類似部分時系列データペアを出力する。
1)
2)
3) 上記1),2)のどちらの不等式も満たさない場合、SinとSoutの両方の時系列データを検索する必要がある。
図8は、本実施形態のデータ検索装置302を説明する図である。データ検索装置302は、逐次流入してくる複数系列の時系列データを受信する受信部11と、
受信部11が受信した前記時系列データを記憶する第1メモリ12と、
第1メモリ12から時系列データを読み出し、所定時間の部分時系列データに分割する区間分割部13と、
区間分割部13が分割した前記部分時系列データについて互いの類似度を求める類似判定部14と、
前記部分時系列データを受信時刻で区別可能な構造を有し、類似判定部14が求めた前記類似度に基づく、区間分割部13で生成された部分時系列データの類似検索索引を作成する索引部15と、
索引部15で作成された前記類似検索索引を記憶するとともに、前記類似検索索引の構造を維持したまま後続の前記部分時系列データを前記類似検索索引にキューとして追記する第2メモリ16と、
区間分割部13で生成された前記部分時系列データをクエリとして、指定された閾値よりも類似した部分時系列データを前記類似検索索引を用いて第2メモリ16から読み出す類似ペア検索部17と、
を備える。
前記類似検索索引の構造を維持したまま後続の前記部分時系列データを前記類似検索索引にキューとして追記し(ステップS203〜ステップS205)、
検索時に前記部分時系列データをクエリとして、指定された閾値よりも類似した部分時系列データを前記類似検索索引を用いて読み出す(ステップS206)。
12:第1メモリ
13:区間分割部
14:類似判定部
15:索引部
16:第2メモリ
17:類似ペア判定部
18:第3メモリ
301、302:データ検索装置
Claims (5)
- 逐次流入してくる複数系列の時系列データを受信する受信部と、
前記受信部が受信した前記時系列データを記憶する第1メモリと、
前記第1メモリから時系列データを読み出し、所定時間の部分時系列データに分割する区間分割部と、
前記区間分割部が分割した前記部分時系列データについて互いの類似度を求める類似判定部と、
前記類似判定部が求めた前記類似度に基づき、前記区間分割部で生成された部分時系列データの類似検索索引を作成する索引部と、
前記索引部で作成された前記類似検索索引を受信時刻毎にキュー構造で記憶する第2メモリと、
前記区間分割部で生成された前記部分時系列データをクエリとして、指定された閾値よりも類似した部分時系列データを前記類似検索索引を用いて前記第2メモリから読み出す類似ペア検索部と、
を備えるデータ検索装置。 - 逐次流入してくる複数系列の時系列データを受信する受信部と、
前記受信部が受信した前記時系列データを記憶する第1メモリと、
前記第1メモリから時系列データを読み出し、所定時間の部分時系列データに分割する区間分割部と、
前記区間分割部が分割した前記部分時系列データについて互いの類似度を求める類似判定部と、
前記部分時系列データを受信時刻で区別可能な構造を有し、前記類似判定部が求めた前記類似度に基づく、前記区間分割部で生成された部分時系列データの類似検索索引を作成する索引部と、
前記索引部で作成された前記類似検索索引を記憶するとともに、前記類似検索索引の構造を維持したまま後続の前記部分時系列データを前記類似検索索引にキューとして追記する第2メモリと、
前記区間分割部で生成された前記部分時系列データをクエリとして、指定された閾値よりも類似した部分時系列データを前記類似検索索引を用いて前記第2メモリから読み出す類似ペア検索部と、
を備えるデータ検索装置。 - 逐次入力される複数系列の時系列データを所定時間の部分時系列データに分割し、前記部分時系列データについて互いの類似度を求め、前記類似度に基づく類似検索索引を作成して受信時刻毎にキュー構造で記憶しておき、
検索時に前記部分時系列データをクエリとして、指定された閾値よりも類似した部分時系列データを前記類似検索索引を用いて読み出すデータ検索方法。 - 逐次入力される複数系列の時系列データを所定時間の部分時系列データに分割し、前記部分時系列データについて互いの類似度を求め、前記部分時系列データを受信時刻で区別可能な構造を有し、前記類似度に基づく1つの類似検索索引を作成して記憶しておき、
前記類似検索索引の構造を維持したまま後続の前記部分時系列データを前記類似検索索引にキューとして追記し、
検索時に前記部分時系列データをクエリとして、指定された閾値よりも類似した部分時系列データを前記類似検索索引を用いて読み出すデータ検索方法。 - 請求項3又は4に記載のデータ検索方法をコンピュータに実行させるデータ検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012028791A JP5632862B2 (ja) | 2012-02-13 | 2012-02-13 | データ検索装置、データ検索方法、及びデータ検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012028791A JP5632862B2 (ja) | 2012-02-13 | 2012-02-13 | データ検索装置、データ検索方法、及びデータ検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013164811A JP2013164811A (ja) | 2013-08-22 |
JP5632862B2 true JP5632862B2 (ja) | 2014-11-26 |
Family
ID=49176108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012028791A Active JP5632862B2 (ja) | 2012-02-13 | 2012-02-13 | データ検索装置、データ検索方法、及びデータ検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5632862B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101970090B1 (ko) | 2015-01-22 | 2019-04-17 | 미쓰비시덴키 가부시키가이샤 | 시계열 데이터 검색 장치 및 기록 매체에 저장된 시계열 데이터 검색 프로그램 |
JP7129235B2 (ja) * | 2018-06-15 | 2022-09-01 | キヤノン株式会社 | 情報処理装置、その制御方法、プログラム、記憶媒体、及びシステム |
CN111309846B (zh) * | 2018-12-12 | 2023-09-05 | 中国移动通信集团四川有限公司 | 索引处理方法、装置、设备及介质 |
CN111859066B (zh) * | 2020-06-03 | 2023-01-20 | 广东电网有限责任公司 | 一种运维工单的查询推荐方法及装置 |
CN115729981B (zh) * | 2022-11-29 | 2024-02-13 | 中国长江电力股份有限公司 | 一种基于编辑距离的相似水情数据挖掘方法及其应用 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3204154B2 (ja) * | 1997-02-21 | 2001-09-04 | 日本電気株式会社 | 時系列データ解析装置 |
JP3916813B2 (ja) * | 1999-10-22 | 2007-05-23 | 株式会社日立製作所 | データ系列検索装置および方法 |
JP4215386B2 (ja) * | 2000-12-15 | 2009-01-28 | 三菱電機株式会社 | 類似オブジェクト検索方法及び類似オブジェクト検索装置 |
JP3960151B2 (ja) * | 2002-07-09 | 2007-08-15 | ソニー株式会社 | 類似時系列検出方法及び装置、並びにプログラム |
JP4275084B2 (ja) * | 2005-02-16 | 2009-06-10 | 日本電信電話株式会社 | 類似時系列データ計算装置、類似時系列データ計算方法、および類似時系列データ計算プログラム |
JP2006338373A (ja) * | 2005-06-02 | 2006-12-14 | Toshiba Corp | 多変数時系列データ分析装置、方法およびプログラム |
-
2012
- 2012-02-13 JP JP2012028791A patent/JP5632862B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013164811A (ja) | 2013-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5678620B2 (ja) | データ処理方法、データ処理システム、及びデータ処理装置 | |
JP5711171B2 (ja) | データ検索装置、データ検索方法、及びデータ検索プログラム | |
Yagoubi et al. | Dpisax: Massively distributed partitioned isax | |
JP5632862B2 (ja) | データ検索装置、データ検索方法、及びデータ検索プログラム | |
JP6183376B2 (ja) | インデックス生成装置及び方法並びに検索装置及び検索方法 | |
CN102693266B (zh) | 搜索数据库的方法、生成索引结构的导航设备和方法 | |
CN112765405B (zh) | 空间数据搜索结果的聚类和查询的方法及系统 | |
CN106897374B (zh) | 一种基于轨迹大数据最近邻查询的个性化推荐方法 | |
Wang et al. | Durable queries over historical time series | |
WO2016006276A1 (ja) | インデックス生成装置及びインデックス生成方法 | |
JP6079270B2 (ja) | 情報提供装置 | |
US20170124162A1 (en) | System and method for subset searching and associated search operators | |
CN103345509B (zh) | 获取路网上复反向最远邻居的层次分区树方法及系统 | |
JP2010277329A (ja) | 近傍探索装置 | |
Chen et al. | Mining and clustering mobility evolution patterns from social media for urban informatics | |
US20160078071A1 (en) | Large scale offline retrieval of machine operational information | |
CN111177190B (zh) | 数据处理方法、装置、电子设备及可读存储介质 | |
CN103309951A (zh) | 在网上搜索多媒体文件的方法和装置 | |
He et al. | Efficient and robust data augmentation for trajectory analytics: A similarity-based approach | |
KR101937989B1 (ko) | 집합 기반 유사 시퀀스 매칭 장치 및 방법 | |
Huang et al. | Processing continuous K-nearest skyline query with uncertainty in spatio-temporal databases | |
CN110880005B (zh) | 向量索引建立方法及装置和向量检索方法及装置 | |
Beecks et al. | Index support for content-based multimedia exploration | |
JP5953262B2 (ja) | データ索引装置、データ索引方法及びプログラム | |
JP7239433B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140305 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140919 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141010 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5632862 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |