JP2013196665A - Data retriever, data retrieval method, and data retrieval program - Google Patents

Data retriever, data retrieval method, and data retrieval program Download PDF

Info

Publication number
JP2013196665A
JP2013196665A JP2012066643A JP2012066643A JP2013196665A JP 2013196665 A JP2013196665 A JP 2013196665A JP 2012066643 A JP2012066643 A JP 2012066643A JP 2012066643 A JP2012066643 A JP 2012066643A JP 2013196665 A JP2013196665 A JP 2013196665A
Authority
JP
Japan
Prior art keywords
series data
time
similar
similarity
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012066643A
Other languages
Japanese (ja)
Other versions
JP5711171B2 (en
Inventor
Hiroshi Kurasawa
央 倉沢
Hiroshi Sato
浩史 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012066643A priority Critical patent/JP5711171B2/en
Publication of JP2013196665A publication Critical patent/JP2013196665A/en
Application granted granted Critical
Publication of JP5711171B2 publication Critical patent/JP5711171B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a data retriever, data retrieval method and data retrieval program capable of suppressing a memory size when retrieving a pair of similar partial time series data from time series data of plural series flowed in within a fixed period from the present to the past.SOLUTION: Time series data of sequentially inputted plural series is divided into partial time series data of a prescribed time, mutual similarity about the partial time series data is calculated, candidates for a pair of similar partial series data and similarity thresholds are stored in each reception time within a designated time range on the basis of the similarity, partial time series data more similar than the stored similarity thresholds among pairs of the generated partial time series data is stored as a provisional similar pair, and a partial similar time series data pair having the most similar given number is read among the stored provisional similar pairs.

Description

本発明は、現在から過去の一定期間内に流入した複数系列の時系列データの中から、類似した部分時系列データのペアを検索するデータ検索装置、データ検索方法、及びデータ検索プログラムに関する。   The present invention relates to a data search apparatus, a data search method, and a data search program for searching for a similar pair of partial time-series data from a plurality of series of time-series data that have flowed within a certain period in the past from the present.

時系列データは、時間的に連続して観測されたデータ系列である。時系列データは環境観測や設備監視、株価、統計情報、メディア処理などで利用されている。   The time series data is a data series observed continuously in time. Time series data is used for environmental observation, equipment monitoring, stock prices, statistical information, media processing, and so on.

時系列データの検索には、事前に蓄積されたデータに対して検索するものと、逐次流入してくるデータに対して検索するものとがある。前者の例としては、過去に定時観測した降水量のデータで類似したパターンを探す処理などがある。後者の例としては、リアルタイムに株価の変動を観測して目的のパターンと一致した瞬間に通知する処理などがある。本発明は後者のリアルタイムな処理を扱う。   There are two types of time-series data search: searching for data stored in advance and searching for data that flows in sequentially. As an example of the former, there is a process of searching for a similar pattern using precipitation data that has been regularly observed in the past. As an example of the latter, there is a process of observing a stock price change in real time and notifying the moment when it matches a target pattern. The present invention deals with the latter real-time processing.

リアルタイムな時系列データ検索の先行技術としては、以下のものが挙げられる。複数系列の同一時刻の時系列データのうち、類似した時系列データのペアを求める検索処理があった(例えば、特許文献1や非特許文献1参照)。特許文献1では閾値よりも類似度の高いペアを、非特許文献1では相関係数が閾値以上のものを探す課題を扱っている。これらの先行技術では、系列数が多いほど類似判定の計算コストが大きくなるため、類似度計算の削減のための次元圧縮や類似度計算回数削減のための索引技術を技術課題としていた。しかしながら、これらの先行技術は時系列データの終点が現在時刻のもののみを扱うという制限をもつ。つまり、時間的なずれのある類似した部分時系列データを対象とした検索には適用できない。   The prior art of real-time time series data search includes the following. There has been a search process for obtaining a pair of similar time-series data among a plurality of series of time-series data at the same time (see, for example, Patent Document 1 and Non-Patent Document 1). Patent Document 1 deals with a problem of searching for a pair having a higher degree of similarity than the threshold, and Non-Patent Document 1 searching for a correlation coefficient that is greater than or equal to the threshold. In these prior arts, the calculation cost for similarity determination increases as the number of series increases, and therefore, the technical problem is a dimensional compression for reducing similarity calculation and an index technique for reducing the number of similarity calculations. However, these prior arts have a limitation that only the end point of the time series data is the current time. That is, it cannot be applied to a search for similar partial time-series data having a time lag.

一方、現在から過去の一定期間内に流入した単一系列の時系列データの中から、類似した部分時系列データのペアを求める検索処理があった(例えば、非特許文献2と非特許文献3参照)。非特許文献2と非特許文献3のいずれも、指定した数の最も類似した部分時系列データのペアを検索する課題を扱っている。これらの先行技術では、検索対象とする時間が長い、もしくは、時系列データの長さに対して部分時系列データが短いほど暫定類似ペアを記憶するメモリサイズが大きくなるため、暫定類似ペア候補の絞り込み方法を技術課題としていた。しかしながら、これらの先行技術は単一系列の時系列データのみを扱うという制限を持つ。つまり、複数系列の時系列データを対象とした検索には適用できない。   On the other hand, there has been a search process for obtaining a pair of similar partial time-series data from a single series of time-series data that has flowed within a certain period in the past from now (for example, Non-Patent Document 2 and Non-Patent Document 3). reference). Both Non-Patent Document 2 and Non-Patent Document 3 address the problem of searching for a specified number of most similar partial time-series data pairs. In these prior arts, the longer the time to be searched, or the shorter the partial time-series data relative to the length of the time-series data, the larger the memory size for storing the temporary similar pairs. The narrowing down method was a technical issue. However, these prior arts have a limitation of handling only a single series of time series data. That is, it cannot be applied to a search for a plurality of time series data.

特開2006−244389号公報JP 2006-244389 A

Abdullah Mueen, Suman Nath and Jie Liu, “Fast Approximate Correlation for Massive Time−series Data”, In Proceedings of the 2010 ACM SIGMOD international conference on Management of data, 2010.Abdullah Muen, Sumna Nat and Jie Liu, “Fast Approximate Correlation for Massive Time-series of Data 20”, In Proceeds of the 20th Ace. Abdullah Mueen and Eamonn Keogh, “Online Discovery and Maintenance of Time Series Motifs”, In Proceedings of the 16th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, 2010.Abdullah Muen and Emanon Keog, “Online Discovery and Maintenance of Time Series 10 Mot.”, In Proceeds of the Cond. Hoang Thanh Lam, Tu Eindhoven, Toon Calders and Ninh Pham, “Online Discovery of Top−k Similar Motifs in Time Series Data”, In Proceedings of the 2011 SIAM International Conference on Data Mining, 2011.Hang Thanh Lam, Tu Eindhoven, Toon Calders and Ninh Pham, “Online Discovery of Top in k Simal Motifs in Time Series,” Yianilos, Peter N, “Data structures and algorithms for nearest neighbor search in general metric spaces”, In Proceedings of the fourth annual ACM−SIAM Symposium on Discrete algorithms. Society for Industrial and Applied Mathematics Philadelphia, pp. 311−321, 1993.Yianilos, Peter N, “Data structures and algorithms for near neighbor neural search in general metrical spaces.” In Proceedings of the ensembleSumNum Society for Industrial and Applied Materials Philadelphia, pp. 311-321, 1993.

上述のように、従来技術は、現在から過去の一定期間内に流入した複数系列の時系列データの中から、類似した部分時系列データのペアを求める検索処理を扱うことができない。つまり、時間的なずれのある類似した部分時系列データを複数系列の時系列データの中から検索することができない。このような検索例としては、1ヶ月間の複数銘柄の株価の時系列データから類似した部分時系列データを検索して、時間的なずれのある特徴的な株価の変動を見つけ出す処理がある。また、複数のセンサ値の時系列データから類似した部分時系列データを検索して、日射から地熱、気温といった時間的なずれの生じる現象を見つけ出す処理も検索例として挙げられる。上述のとおり、複数系列の時系列データを対象とした先行技術や、時間的なずれのある類似した部分時系列データを対象とした先行技術はあるが、この2つを同時に満たす時系列データ検索処理技術は見当たらない。   As described above, the prior art cannot handle a search process for obtaining a similar pair of partial time-series data from a plurality of series of time-series data that has flowed within a certain period in the past from the present. That is, it is not possible to retrieve similar partial time-series data having a time lag from a plurality of series of time-series data. As an example of such a search, there is a process of searching for similar partial time-series data from the time-series data of stock prices of a plurality of issues for one month to find characteristic stock price fluctuations with a time lag. Another example of a search is a process of searching for similar partial time-series data from time-series data of a plurality of sensor values to find a phenomenon in which a time lag such as geothermal heat or air temperature occurs from solar radiation. As described above, there are prior arts for multiple series of time series data and prior arts for similar partial time series data with time lag, but time series data search that satisfies these two simultaneously There is no processing technology.

上記2つを同時に満たす時系列データ検索処理では、現在から過去の一定期間内に流入した複数系列の時系列データの中から、与えられた数の最も類似した部分時系列データのペアを探す検索処理を扱うことになる。この検索処理は、メモリサイズを抑えることが求められており、暫定類似ペア候補の絞り込みが解決すべき技術課題となっている。ここで、「与えられた数の最も類似した部分時系列データのペアを探す検索処理」とは、「要求されている出力数k(ペアの個数)が入力されたとき、最類似からk番目までの部分時系列データのペアを検索して出力する処理」を意味する。   In the time-series data search process that satisfies the above two simultaneously, a search for searching for a given number of the most similar partial time-series data pairs from a plurality of series of time-series data that has flowed in from the present within a certain period in the past. Will handle the process. This search process is required to reduce the memory size, and narrowing down the provisional similar pair candidates is a technical problem to be solved. Here, “a search process for finding a given number of most similar partial time-series data pairs” means “when the requested number of outputs k (number of pairs) is input, Means a process of searching for and outputting a pair of partial time series data up to.

与えられた数の最も類似した部分時系列データのペアを探す検索要求を扱うとき、検索対象とする時系列データの時間が長い、もしくは時系列データの長さに対して部分時系列データが短いほど、暫定類似ペアの数が増える。暫定類似ペアの数が多いと、それらを記憶するメモリサイズが大きくなる。また、暫定類似ペアを絞りこめないと、暫定類似ペア間の類似度の閾値を大きく見積もってしまうことになり、検索索引を使った枝刈りが難しく、距離計算回数が大きくなる。以上の理由から、メモリサイズを抑えるためには暫定類似ペアの絞り込みが必要という課題がある。ここで、「枝刈り」とは、検索対象とならないデータを予め除去しておくという意味である。   When handling a search request to find a given number of the most similar partial time-series data pairs, the time-series data to be searched is long, or the partial time-series data is short relative to the length of the time-series data As the number of temporary similar pairs increases, the number increases. When the number of provisional similar pairs is large, the memory size for storing them increases. If the temporary similar pairs are not narrowed down, the threshold value of the similarity between the temporary similar pairs is greatly estimated, so that pruning using the search index is difficult, and the number of distance calculations increases. For the above reasons, there is a problem that it is necessary to narrow down temporary similar pairs in order to reduce the memory size. Here, “pruning” means that data not to be searched is removed in advance.

本発明は、上記課題を解消するためになされたものであり、その目的は、現在から過去の一定期間内に流入した複数系列の時系列データの中から、類似した部分時系列データのペアを検索するに際し、必要とするメモリサイズを抑えることができるデータ検索装置、データ検索方法、及びデータ検索プログラムを提供することにある。   The present invention has been made to solve the above-mentioned problems, and its purpose is to create a pair of similar partial time-series data from a plurality of series of time-series data that have flowed within a certain period in the past from the present. An object of the present invention is to provide a data search device, a data search method, and a data search program that can reduce the required memory size when searching.

本発明は、新しい受信時刻の部分時系列データの挿入と古い受信時刻の部分時系列データの削除が容易なデータ構造で、かつ、部分時系列データを受信時刻ごとに区別して枝刈りするアルゴリズム採用することとした。   The present invention adopts an algorithm that easily inserts partial time-series data at a new reception time and deletes partial time-series data at an old reception time, and uses an algorithm for distinguishing and pruning partial time-series data for each reception time. It was decided to.

本発明に係るデータ検索装置は、逐次流入してくる複数系列の時系列データを受信する受信部と、前記受信部が受信した前記時系列データを記憶する第1メモリと、前記第1メモリから時系列データを読み出し、所定時間の部分時系列データに分割する区間分割部と、前記区間分割部が分割した前記部分時系列データについて互いの類似度を求める類似判定部と、前記区間分割部で生成される前記部分時系列データのペアの中から前記類似判定部が求めた類似度に基づき、所定の類似度の閾値よりも類似した部分時系列データを暫定類似ペア候補として検索して記憶させる暫定類似ペア候補検索部と、前記暫定類似ペア候補検索部の検索する前記暫定類似ペア候補及び前記所定の類似度の閾値を記憶する第3メモリと、前記第3メモリから読み出された前記暫定類似ペア候補から、類似度の閾値判定と類似ペアの絞込みをする類似ペア判定部と、を備える。   A data search device according to the present invention includes a receiving unit that receives a plurality of time series data that sequentially flows in, a first memory that stores the time series data received by the receiving unit, and a first memory A section dividing unit that reads time-series data and divides it into partial time-series data of a predetermined time, a similarity determination unit that obtains a similarity between the partial time-series data divided by the section dividing unit, and the section dividing unit Based on the similarity obtained by the similarity determination unit from the generated partial time-series data pairs, partial time-series data similar to a predetermined similarity threshold is searched and stored as a temporary similar pair candidate. A temporary similar pair candidate search unit; a third memory for storing the temporary similar pair candidate searched by the temporary similar pair candidate search unit and a threshold value of the predetermined similarity; and reading from the third memory From the issued the provisional similarity pair candidates, and a similar pair determination unit that the narrowing of similar pairs and threshold determination of similarity.

本発明に係るデータ検索方法は、逐次入力される複数系列の時系列データを所定時間の部分時系列データに分割し、前記部分時系列データについて互いの類似度を求め、前記類似度に基づいて、指定された時間範囲の受信時刻毎に、類似した部分時系列データのペアの候補と類似度の閾値を記憶しておき、生成された部分時系列データのペアの中から、記憶した類似度の閾値よりも類似した部分時系列データを暫定類似ペアとして記憶しておき、記憶した暫定類似ペアの中から、与えられた数の最も類似した部分類似時系列データペアを読み出す。   The data search method according to the present invention divides time-series data of a plurality of sequences that are sequentially input into partial time-series data of a predetermined time, obtains a similarity between the partial time-series data, and based on the similarity For each reception time in the specified time range, a similar partial time series data pair candidate and a similarity threshold value are stored, and the stored similarity degree is selected from the generated partial time series data pairs. Partial time-series data similar to the threshold value is stored as a temporary similar pair, and a given number of most similar partial similar time-series data pairs are read from the stored temporary similar pairs.

本発明は、指定された時間範囲の受信時刻毎に暫定類似ペアを管理することで、古い受信時刻で暫定類似ペア候補には含まれるが類似ペアの閾値を満たさない部分時系列データのペアの判定と絞込みを高速にできるようになる。このため、本発明は、検索対象とする時系列データの時間が長い、もしくは時系列データの長さに対して部分時系列データが短いときに、メモリサイズの削減を実現することができる。   The present invention manages temporary similar pairs for each reception time in a specified time range, so that a pair of partial time-series data that is included in the temporary similar pair candidates at the old reception time but does not satisfy the similar pair threshold value. Judgment and refinement can be performed at high speed. Therefore, the present invention can reduce the memory size when the time-series data to be searched is long or when the partial time-series data is short with respect to the length of the time-series data.

従って、本発明は、現在から過去の一定期間内に流入した複数系列の時系列データの中から、類似した部分時系列データのペアを検索するに際し、メモリサイズを抑えることができるデータ検索装置及びデータ検索方法を提供することができる。   Therefore, the present invention provides a data search device capable of suppressing the memory size when searching for a similar pair of partial time-series data from a plurality of series of time-series data that has flowed within a certain period in the past from the present, and A data search method can be provided.

本発明に係るデータ検索装置は、前記暫定類似ペア候補検索部が、前記区間分割部で生成される前記部分時系列データのペアの中から前記類似判定部が求めた類似度に基づき、部分時系列データを受信時刻で区別可能な構造を有した類似検索索引を作成する索引部と、前記索引部で作成された類似検索索引を記憶する第2メモリと、を備える。   In the data search device according to the present invention, the temporary similar pair candidate search unit performs a partial time based on the similarity obtained by the similarity determination unit from the partial time-series data pairs generated by the section division unit. An index unit that creates a similar search index having a structure that can distinguish series data according to reception time, and a second memory that stores the similar search index created by the index unit.

本発明に係るデータ検索方法は、前記部分時系列データについて互いの類似度を求める際、前記部分時系列データの受信時刻で区別可能な構造を有した類似検索索引を使って、前記部分時系列データの受信時刻毎の類似度の閾値で絞り込む。   The data search method according to the present invention uses the similarity search index having a structure distinguishable by the reception time of the partial time series data when obtaining the similarity between the partial time series data. Filter by the threshold of similarity at each data reception time.

従って、本発明は、現在から過去の一定期間内に流入した複数系列の時系列データの中から、類似した部分時系列データのペアを検索するに際し、必要とする距離計算コストを抑えることができるデータ検索装置及びデータ検索方法を提供することができる。   Therefore, according to the present invention, it is possible to reduce the distance calculation cost required when searching for a pair of similar partial time-series data from a plurality of time-series data that has flowed in from the present within a certain period in the past. A data search device and a data search method can be provided.

本発明に係るデータ検索プログラムは、前記データ検索方法をコンピュータに実行させる。   A data search program according to the present invention causes a computer to execute the data search method.

本発明は、現在から過去の一定期間内に流入した複数系列の時系列データの中から、類似した部分時系列データのペアを検索するに際し、メモリサイズを抑えることができるデータ検索装置及びデータ検索方法を提供することができる。   The present invention relates to a data search device and a data search capable of reducing the memory size when searching for a similar partial time-series data pair from a plurality of time-series data that has flowed within a certain period in the past from the present. A method can be provided.

類似部分時系列ペアを説明するイメージの図である。It is a figure of the image explaining a similar partial time series pair. 本発明に係るデータ検索装置を説明する図である。It is a figure explaining the data search device concerning the present invention. 本発明に係るデータ検索方法を説明する図である。It is a figure explaining the data search method which concerns on this invention. 本発明に係るデータ検索装置が時系列データを部分時系列データに分割するときのイメージの図である。It is a figure of an image when the data search device concerning the present invention divides time series data into partial time series data. 類似ペアの絞込みのイメージ図である。It is an image figure of narrowing down a similar pair.

添付の図面を参照して本発明の実施形態を説明する。以下に説明する実施形態は本発明の実施例であり、本発明は、以下の実施形態に制限されるものではない。なお、本明細書及び図面において符号が同じ構成要素は、相互に同一のものを示すものとする。   Embodiments of the present invention will be described with reference to the accompanying drawings. The embodiments described below are examples of the present invention, and the present invention is not limited to the following embodiments. In the present specification and drawings, the same reference numerals denote the same components.

図1は、類似部分時系列ペアのイメージの図である。実施形態の装置では与えられた数の最も類似した部分類似時系列データペアを検索する。   FIG. 1 is a diagram of an image of similar partial time series pairs. The apparatus of the embodiment retrieves a given number of most similar partially similar time series data pairs.

図2は、本実施形態のデータ検索装置303を説明する図である。データ検索装置303は、逐次流入してくる複数系列の時系列データを受信する受信部11と、受信部11が受信した前記時系列データを記憶する第1メモリ12と、第1メモリ12から時系列データを読み出し、所定時間の部分時系列データに分割する区間分割部13と、区間分割部13が分割した前記部分時系列データについて互いの類似度を求める類似判定部14と、区間分割部13で生成される前記部分時系列データのペアの中から類似判定部14が求めた類似度に基づき、所定の類似度の閾値よりも類似した部分時系列データを暫定類似ペア候補として検索して記憶させる暫定類似ペア候補検索部19と、暫定類似ペア候補検索部19の検索する前記暫定類似ペア候補及び前記所定の類似度の閾値を記憶する第3メモリ18と、第3メモリ18から読み出された前記暫定類似ペア候補から、類似度の閾値判定と類似ペアの絞込みをする類似ペア判定部17と、を備える。   FIG. 2 is a diagram illustrating the data search apparatus 303 according to this embodiment. The data search device 303 includes a receiving unit 11 that receives time series data of a plurality of series that sequentially flows in, a first memory 12 that stores the time series data received by the receiving unit 11, and a time from the first memory 12. The section dividing unit 13 that reads out the series data and divides it into partial time series data of a predetermined time, the similarity determination unit 14 that obtains the similarity between the partial time series data divided by the section dividing unit 13, and the section dividing unit 13 Based on the similarity obtained by the similarity determination unit 14 from the partial time-series data pairs generated in Step 1, partial time-series data that is more similar than a predetermined similarity threshold is searched for and stored as a temporary similar pair candidate. A temporary similar pair candidate search unit 19 to be executed, a third memory 18 for storing the temporary similar pair candidate searched by the temporary similar pair candidate search unit 19 and the predetermined similarity threshold, Provided from the provisional similarity pair candidates read out from the memory 18, a similar pair determination unit 17 for the narrowing of similar pairs and threshold determination of similarity, a.

図3は、データ検索装置303が行うデータ検索方法を説明する図である。本データ検索方法は、逐次入力される複数系列の時系列データを所定時間の部分時系列データに分割し(ステップS301、S302)、前記部分時系列データについて互いの類似度を求め、前記類似度に基づいて、指定された時間範囲の受信時刻毎に、類似した部分時系列データのペアの候補と類似度の閾値を記憶しておき(ステップS303)、生成された部分時系列データのペアの中から、記憶した類似度の閾値よりも類似した部分時系列データを暫定類似ペアとして記憶しておき(ステップS304)、記憶した暫定類似ペアの中から、与えられた数の最も類似した部分類似時系列データペアを読み出す(ステップS305)。   FIG. 3 is a diagram for explaining a data search method performed by the data search device 303. In this data search method, time series data of a plurality of series that are sequentially input are divided into partial time series data of a predetermined time (steps S301 and S302), and the similarity is obtained for the partial time series data, and the similarity is obtained. Based on the above, for each reception time in the designated time range, a similar partial time-series data pair candidate and a similarity threshold are stored (step S303), and the generated partial time-series data pair is stored. Among them, partial time-series data that is more similar than the stored threshold of similarity is stored as a temporary similar pair (step S304), and a given number of most similar partial similarities are stored among the stored temporary similar pairs. A time series data pair is read (step S305).

k個の最も類似した部分時系列データペアを探索する場合の実施例について述べる。
ステップS301において、受信部11は、逐次流入してくる複数系列の時系列データを受信して第1メモリ12に記憶させる。第1メモリ12の容量に制限がある場合は、指定された時間範囲外の受信時刻の時系列データを第1メモリ12から削除する。第1メモリ12の最低限必要な記憶容量は、検索対象とする部分時系列データ長をm、検索対象とする時間長をw、系列数をnとすると、n(m+w−1)の要素数を蓄積できる容量となる。
An embodiment in the case of searching for the k most similar partial time series data pairs will be described.
In step S <b> 301, the reception unit 11 receives a plurality of time series data that sequentially flows and stores the time series data in the first memory 12. When the capacity of the first memory 12 is limited, the time series data of the reception time outside the designated time range is deleted from the first memory 12. The minimum required storage capacity of the first memory 12 is the number of elements of n (m + w−1), where m is the partial time series data length to be searched, w is the time length to be searched, and n is the number of series. It becomes the capacity which can be stored.

ステップS302において、区間分割部13は、第1メモリ12から時系列データを読みだして、指定された区間時間の部分時系列データに分割する。本実施形態における部分時系列データとは、逐次流入してくる時間的に連続したデータ系列のうち、指定された区間時間の連続したデータ系列をいう。区間分割部13では新しい時系列データを受信するたびに、各時系列データの直近の長さmの部分時系列データを分割して、暫定類似ペア候補検索部19に部分時系列データを入力する。また、類似ペア判定部17から指定された時間の長さmの部分時系列データを分割して返す。図4は、区間分割部13が時系列データを部分時系列データに分割するときのイメージの図である。図中の

Figure 2013196665
は受信時刻tにおける系列のIDがiの部分時系列データを表している。 In step S302, the section dividing unit 13 reads the time series data from the first memory 12, and divides it into partial time series data of the designated section time. The partial time series data in the present embodiment refers to a continuous data series in a specified section time among temporally continuous data series that sequentially flow in. Each time new time series data is received, the section division unit 13 divides the partial time series data of the most recent length m of each time series data and inputs the partial time series data to the provisional similar pair candidate search unit 19. . In addition, the partial time-series data of the length m of time specified from the similar pair determination unit 17 is divided and returned. FIG. 4 is a diagram of an image when the section dividing unit 13 divides time series data into partial time series data. In the figure
Figure 2013196665
The ID of the sequences in reception time t x represents a partial time-series data of i.

ステップS303において、類似判定部14は部分時系列データ間の類似度を計算する。本実施形態における類似度とは、2つの部分時系列データがどの程度類似しているかを数値で表す指標である。特に、本実施形態においては、2つの部分時系列データ

Figure 2013196665
の類似度Distにユークリッド距離を採用し、以下の通り定義する。
Figure 2013196665
In step S303, the similarity determination unit 14 calculates the similarity between the partial time series data. The similarity in the present embodiment is an index that expresses how similar two partial time-series data are numerically. In particular, in this embodiment, two partial time series data
Figure 2013196665
The Euclidean distance is adopted as the similarity degree Dist and is defined as follows.
Figure 2013196665

なお、本発明のいう類似度は、上記特徴を満たす様々な距離がその対象となるものであって、ユークリッド距離に限られない。具体的に一例を挙げると、Dynamic time warpingやEarth Mover’s Distance、編集距離、ハミング距離、Jaccard係数距離、コサイン類似度、マンハッタン距離、マハラノビス距離などを含む時系列データ間の類似度を表す距離であってよい。さらに、これらの距離に加えて、部分時系列のオフセットや振幅を調整したものに対する距離であってもよい。   It should be noted that the similarity referred to in the present invention is subject to various distances that satisfy the above characteristics, and is not limited to the Euclidean distance. Specifically, for example, distances representing similarity between time series data including Dynamic time warping, Earth Move's distance, editing distance, Hamming distance, Jaccard coefficient distance, cosine similarity, Manhattan distance, Mahalanobis distance, etc. It may be. Furthermore, in addition to these distances, distances to those adjusted for partial time series offset and amplitude may be used.

第3メモリ18は、受信時刻ごとの類似した部分時系列データのペアの候補と類似度の閾値を記憶する。   The third memory 18 stores similar partial time-series data pairs for each reception time and a similarity threshold.

受信時刻ごとの類似した部分時系列データのペアの候補は暫定類似ペア候補検索部19によって書き換えられ、受信時刻ごとの類似度の閾値は暫定類似ペア候補検索部19と類似ペア判定部17によって書き換えられる。   Similar partial time-series data pair candidates for each reception time are rewritten by the temporary similar pair candidate search unit 19, and the similarity threshold for each reception time is rewritten by the temporary similar pair candidate search unit 19 and the similar pair determination unit 17. It is done.

ステップS303において、暫定類似ペア候補検索部19は、与えられた数の最も類似した部分時系列データペアに含まれうる暫定類似ペアと、受信時刻別の類似度の閾値を第3メモリで管理する。暫定類似ペア候補検索部19は、暫定類似ペアを受信時刻別にヒープ構造で蓄積し、さらにそのヒープを受信時刻の順にキュー構造で管理する。各ヒープは最大k個の部分時系列データのペアとデータ間の類似度を蓄積する。暫定類似ペアに含まれる部分時系列データのペアは、2つの部分時系列データのうち古いほうの受信時刻を基準に整理する。例えば、数2の部分時系列データ(t<t)でのペアを管理する場合、tの受信時刻にもとづいて整理する。こうすることで、最も古い受信時刻の暫定類似ペアの削除を容易にし、さらに各受信時刻で最も距離が大きい類似ペアを容易に削除できるようにしている。 In step S303, the temporary similar pair candidate search unit 19 manages the temporary similar pairs that can be included in the given number of the most similar partial time-series data pairs and the similarity threshold for each reception time in the third memory. . The temporary similar pair candidate search unit 19 accumulates the temporary similar pairs in the heap structure according to the reception time, and further manages the heap in the queue structure in the order of the reception time. Each heap accumulates a maximum of k partial time-series data pairs and the similarity between the data. The partial time-series data pairs included in the provisional similar pair are arranged based on the older reception time of the two partial time-series data. For example, when managing pairs of partial time-series data (t x <t y ) of Equation 2, they are organized based on the reception time of t x . In this way, the provisional similar pair with the oldest reception time can be easily deleted, and the similar pair with the longest distance at each reception time can be easily deleted.

ステップS304において、暫定類似ペア候補検索部19は、区間分割部13で分割した最新の受信時刻の部分時系列データをクエリとして、区間分割部13で読み込める部分時系列データとの距離が受信時刻別の類似度の閾値よりも類似した部分時系列データを探し、暫定類似ペアのヒープのキューに追加する。   In step S304, the provisional similar pair candidate search unit 19 uses the partial time-series data of the latest reception time divided by the section dividing unit 13 as a query, and the distance from the partial time-series data that can be read by the section dividing unit 13 depends on the reception time. The partial time-series data that is more similar than the similarity threshold is searched for and added to the heap queue of the temporary similar pair.

データ検索装置303では、この類似した部分時系列データを探すコストを削減するため、暫定類似ペア候補検索部19には索引部15と第2メモリ16を採用して類似検索索引を構築してもよい。このとき、索引部15と第2メモリ16は、部分時系列データについて互いの類似度を求める際、部分時系列データの受信時刻で区別可能な構造を有した類似検索索引を使って、部分時系列データの受信時刻毎の類似度の閾値で絞り込む。具体的には、索引部15と第2メモリ16は、区間分割部13で分割した最新の受信時刻の部分時系列データを基準とした類似検索索引を1つ新たにつくり、第2メモリ16の索引を蓄積するキューに追加する。同時に、指定された時間範囲外の受信時刻の類似検索索引を第2メモリ16の索引を蓄積するキューから削除する。   In the data search device 303, in order to reduce the cost of searching for similar partial time series data, the temporary similar pair candidate search unit 19 may employ the index unit 15 and the second memory 16 to construct a similar search index. Good. At this time, the index unit 15 and the second memory 16 use the similar search index having a structure that can be distinguished by the reception time of the partial time-series data when the similarity between the partial time-series data is obtained. Narrow down by the similarity threshold for each reception time of the series data. Specifically, the index unit 15 and the second memory 16 newly create a similar search index based on the partial time-series data of the latest reception time divided by the section dividing unit 13. Add to the queue that accumulates the index. At the same time, the similar search index of the reception time outside the designated time range is deleted from the queue storing the index of the second memory 16.

[類似検索索引の作成方法]
本実施形態における類似検索索引は、距離空間の類似検索索引Vantage Point Tree(VPT)(非特許文献4参照)を採用し、以下の手順で作成する。この索引は、基準となる部分時系列データ(基準部分時系列データ)1つと分割距離1つを定めて、基準部分時系列データからの距離と分割距離に基づいて索引対象の複数の部分時系列データを2つに分類することを繰り返して作成する。ここで、受信時刻tの部分時系列データ集合Sを2分類する例を説明する。基準となる系列pの部分時系列データS をSから一つ選び、Sを均等2分割できる距離をr としたとき、Sは、

Figure 2013196665
の2つの部分時系列データ集合SinとSoutに分類される。SinとSoutも同様にそれぞれで基準となる部分時系列データと分割距離を決めてさらに空間を2分類することを繰り返すことで、木構造の類似検索索引をつくる。この類似検索索引は、葉ノードと内部ノードという2種類のノードで構成される。葉ノードは木構造の末端のノードであり、内部ノードは末端以外に位置するノードをいう。分類のたびに必要となるS とr は、内部ノードを生成して管理する。十分に小さい数の部分時系列データ集合まで繰り返し分類して必要な数の内部ノードを生成した後は、葉ノードを生成してSを管理する。つまり、内部ノードは分類に必要な情報(S 、r )を管理し、葉ノードでは部分時系列データ集合を管理する。 [How to create a similar search index]
The similarity search index in this embodiment adopts a similarity search index Vantage Point Tree (VPT) (see Non-Patent Document 4) in the metric space, and is created by the following procedure. This index defines one partial time series data (reference partial time series data) and one division distance as a reference, and a plurality of partial time series to be indexed based on the distance and division distance from the reference partial time series data Create data by repeatedly classifying data into two. Here, an example of 2 classify partial time-series data set S t of reception time t. The partial time-series data S p t in relation to the standard sequence p select one from S t, and the distance that can be evenly divided into two S t was r p t, S t is
Figure 2013196665
Are classified into two partial time series data sets S in and S out . Similarly for S in and S out , a similar search index having a tree structure is created by repeatedly determining the partial time series data and the division distance as reference and further classifying the space into two. This similar search index is composed of two types of nodes, leaf nodes and internal nodes. The leaf node is a node at the end of the tree structure, and the internal node is a node located at a position other than the end. S p t and r p t required for each classification are generated by managing internal nodes. After iteratively classifying a sufficiently small number of partial time-series data sets and generating the required number of internal nodes, leaf nodes are generated and St is managed. That is, the internal node manages information (S p t , r p t ) necessary for classification, and the leaf node manages a partial time-series data set.

本発明の類似検索索引の作成方法はこれに限るものでなく、部分時系列データを受信時刻で区別可能な構造であればよく、複数の類似検索索引をキュー構造で管理せずに1つの類似検索索引に集約することも可能である。   The method for creating a similar search index according to the present invention is not limited to this, and any similar structure can be used as long as partial time-series data can be distinguished by reception time. It is also possible to aggregate into a search index.

また、本発明の範囲はこれに限るものでなく、類似検索索引を持たないで暫定類似ペア候補を探すことも可能である。さらに、本発明の範囲はこれに限るものでなく、次元圧縮技術で類似した部分時系列データを探すコストを削減することもできる。具体的な一例を挙げると、Discrete Fourier Transformation(DFT)、Singular Value Decomposition(SVD)、Piecewise Aggregate Approximation(PAA)、Symbolic Aggregate Approximation(SAX)などを含む。   Further, the scope of the present invention is not limited to this, and it is also possible to search for a provisional similar pair candidate without having a similar search index. Furthermore, the scope of the present invention is not limited to this, and it is possible to reduce the cost of searching for similar partial time-series data using a dimensional compression technique. Specific examples include Discrete Fourier Transform (DFT), Single Value Decomposition (SVD), Piecewise Aggregate Application (PAA), and SymbolicAggregateAx.

受信時刻別の類似度の閾値は、受信時刻別のヒープに蓄積される暫定類似ペアが上限数kに達したとき、ヒープに蓄積されている暫定類似ペアの距離の最大値に更新される。   The similarity threshold for each reception time is updated to the maximum value of the distance between the provisional similar pairs stored in the heap when the number of provisional similar pairs stored in the heap for each reception time reaches the upper limit number k.

ステップ305において、類似ペア判定部17は、第3メモリ18から読み出された類似部分時系列データの暫定類似ペア候補から、類似度の閾値判定と類似ペア候補の絞り込みをする。類似ペア判定部17は、最大kペアの類似ペア候補を管理できるヒープを1つ生成する。そして、新しい受信時刻の暫定類似ペア候補から順に、ヒープに追加する。各受信時刻でヒープを追加した後、受信時刻別の類似度の閾値をヒープの管理するペア間の距離の最大値に設定する。この新しい閾値よりも類似していない暫定類似ペアを受信時刻別暫定類似ペアのヒープから削除する。この手順によって、新しい受信時刻ほど暫定類似ペアの距離の閾値は大きい値が設定される。また、この手順によって、受信時刻別のヒープに蓄積する暫定類似ペアを上限数kよりも下回る数に絞り込み、ヒープを記憶する第3メモリに必要なメモリサイズを削減する。   In step 305, the similar pair determination unit 17 performs similarity threshold determination and narrows down similar pair candidates from provisional similar pair candidates of the similar partial time-series data read from the third memory 18. The similar pair determination unit 17 generates one heap that can manage up to k pairs of similar pair candidates. And it adds to a heap in an order from the provisional similar pair candidate of new reception time. After adding a heap at each reception time, the similarity threshold for each reception time is set to the maximum distance between pairs managed by the heap. The temporary similar pair that is not more similar than the new threshold is deleted from the heap of the temporary similar pair for each reception time. By this procedure, the threshold value of the distance of the temporary similar pair is set to be larger as the reception time is new. Also, by this procedure, the number of temporary similar pairs stored in the heap for each reception time is narrowed down to a number lower than the upper limit number k, and the memory size required for the third memory for storing the heap is reduced.

図5は、類似ペアの絞り込みのイメージ図を示す。t−4からtの範囲の受信時刻で上位3件の類似部分時系列ペアを探す様子を表している。図上段の網模様の部分は受信時刻tの部分時系列データを含む、新たに暫定類似ペア候補に追加されたペアを表している。図中段では、類似ペア候補を格納するヒープに、受信時刻の新しい暫定類似ペアを追加していき、ヒープを更新していく様子を表している。図下段は、類似ペア候補のヒープを更新していく過程で生成した暫定類似ペアの距離の閾値を表している。   FIG. 5 shows an image diagram of narrowing down similar pairs. It shows how the top three similar partial time series pairs are searched for at reception times in the range from t-4 to t. The net pattern portion in the upper part of the drawing represents a pair newly added to the temporary similar pair candidate including partial time-series data at the reception time t. The middle part of the figure shows a state where a temporary similar pair with a new reception time is added to the heap storing similar pair candidates and the heap is updated. The lower part of the figure represents a threshold value of the distance between temporary similar pairs generated in the process of updating the heap of similar pair candidates.

以上の手順で、データ検索装置303は、現在から過去の一定期間内に流入した複数系列の時系列データの中から、与えられた数の最も類似した部分時系列データペアを検索する。   With the above procedure, the data search device 303 searches for a given number of most similar partial time-series data pairs from among a plurality of series of time-series data that have flowed within a certain period in the past from the present.

本発明のデータ検索方法をコンピュータに実行させるデータ検索プログラムは、前述した手順をコンピュータに実行させるものである。   A data search program for causing a computer to execute the data search method of the present invention causes a computer to execute the above-described procedure.

11:受信部
12:第1メモリ
13:区間分割部
14:類似判定部
15:索引部
16:第2メモリ
17:類似ペア判定部
18:第3メモリ
19:暫定類似ペア候補検索部
303:データ検索装置
11: receiving unit 12: first memory 13: section dividing unit 14: similarity determining unit 15: index unit 16: second memory 17: similar pair determining unit 18: third memory 19: provisional similar pair candidate searching unit 303: data Search device

Claims (5)

逐次流入してくる複数系列の時系列データを受信する受信部と、
前記受信部が受信した前記時系列データを記憶する第1メモリと、
前記第1メモリから時系列データを読み出し、所定時間の部分時系列データに分割する区間分割部と、
前記区間分割部が分割した前記部分時系列データについて互いの類似度を求める類似判定部と、
前記区間分割部で生成される前記部分時系列データのペアの中から前記類似判定部が求めた類似度に基づき、所定の類似度の閾値よりも類似した部分時系列データを暫定類似ペア候補として検索して記憶させる暫定類似ペア候補検索部と、
前記暫定類似ペア候補検索部の検索する前記暫定類似ペア候補及び前記所定の類似度の閾値を記憶する第3メモリと、
前記第3メモリから読み出された前記暫定類似ペア候補から、類似度の閾値判定と類似ペアの絞込みをする類似ペア判定部と
を備えるデータ検索装置。
A receiving unit for receiving time series data of a plurality of series that sequentially flows;
A first memory for storing the time-series data received by the receiving unit;
An interval dividing unit that reads time-series data from the first memory and divides the time-series data into partial time-series data of a predetermined time;
A similarity determination unit for obtaining a similarity between the partial time-series data divided by the section dividing unit;
Based on the similarity obtained by the similarity determination unit from the partial time series data pairs generated by the section division unit, partial time series data that is more similar than a predetermined similarity threshold is set as a temporary similar pair candidate. A provisional similar pair candidate search unit for searching and storing;
A third memory for storing the temporary similar pair candidate searched by the temporary similar pair candidate search unit and the predetermined similarity threshold;
A data search apparatus comprising: a similar pair determination unit that determines a similarity threshold and narrows similar pairs from the temporary similar pair candidates read from the third memory.
前記暫定類似ペア候補検索部が、
前記区間分割部で生成される前記部分時系列データのペアの中から前記類似判定部が求めた類似度に基づき、部分時系列データを受信時刻で区別可能な構造を有した類似検索索引を作成する索引部と、
前記索引部で作成された類似検索索引を記憶する第2メモリと、
を備えることを特徴とする請求項1に記載のデータ検索装置。
The provisional similar pair candidate search unit
Create a similarity search index having a structure capable of distinguishing partial time-series data by reception time based on the similarity obtained by the similarity determination unit from the partial time-series data pairs generated by the section division unit An index part to be
A second memory for storing a similar search index created by the index unit;
The data search apparatus according to claim 1, further comprising:
逐次入力される複数系列の時系列データを所定時間の部分時系列データに分割し、前記部分時系列データについて互いの類似度を求め、前記類似度に基づいて、指定された時間範囲の受信時刻毎に、類似した部分時系列データのペアの候補と類似度の閾値を記憶しておき、生成された部分時系列データのペアの中から、記憶した類似度の閾値よりも類似した部分時系列データを暫定類似ペアとして記憶しておき、記憶した暫定類似ペアの中から、与えられた数の最も類似した部分類似時系列データペアを読み出すデータ検索方法。   A plurality of time series data that are sequentially input are divided into partial time series data of a predetermined time, a similarity between the partial time series data is obtained, and a reception time in a specified time range is determined based on the similarity For each pair of similar partial time series data, a threshold value of similarity and a similarity threshold are stored, and from the generated partial time series data pair, a partial time series similar to the stored similarity threshold value is stored. A data search method in which data is stored as a temporary similar pair, and a given number of most similar partially similar time-series data pairs are read from the stored temporary similar pairs. 前記部分時系列データについて互いの類似度を求める際、前記部分時系列データの受信時刻で区別可能な構造を有した類似検索索引を使って、前記部分時系列データの受信時刻毎の類似度の閾値で絞り込むことを特徴とする請求項3に記載のデータ検索方法。   When obtaining the similarity between the partial time-series data, the similarity search index having a structure distinguishable by the reception time of the partial time-series data is used to determine the similarity of the partial time-series data for each reception time. 4. The data search method according to claim 3, wherein the data is narrowed down by a threshold. 請求項3又は4に記載のデータ検索方法をコンピュータに実行させるデータ検索プログラム。   A data search program for causing a computer to execute the data search method according to claim 3 or 4.
JP2012066643A 2012-03-23 2012-03-23 Data search device, data search method, and data search program Active JP5711171B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012066643A JP5711171B2 (en) 2012-03-23 2012-03-23 Data search device, data search method, and data search program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012066643A JP5711171B2 (en) 2012-03-23 2012-03-23 Data search device, data search method, and data search program

Publications (2)

Publication Number Publication Date
JP2013196665A true JP2013196665A (en) 2013-09-30
JP5711171B2 JP5711171B2 (en) 2015-04-30

Family

ID=49395453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012066643A Active JP5711171B2 (en) 2012-03-23 2012-03-23 Data search device, data search method, and data search program

Country Status (1)

Country Link
JP (1) JP5711171B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015089163A (en) * 2013-10-28 2015-05-07 パナソニックIpマネジメント株式会社 Behavior evaluation device, behavior evaluation system, behavior evaluation method, and program
JP2016024619A (en) * 2014-07-18 2016-02-08 富士通株式会社 Information processing method, information processing device and information processing program
JP2017211772A (en) * 2016-05-24 2017-11-30 株式会社日立製作所 Adverse effect analysis system, and adverse effect analysis method
US10223069B2 (en) 2015-01-22 2019-03-05 Mitsubishi Electric Corporation Time-series data search device and computer readable medium
JP2020086843A (en) * 2018-11-22 2020-06-04 株式会社エクセディ Data analysis device, data analysis method, control program, and recording medium
JP2020149466A (en) * 2019-03-14 2020-09-17 株式会社日立製作所 System and method for monitoring time-series data

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240716A (en) * 1997-02-21 1998-09-11 Nec Corp Device for analyzing time sequential data and machine readable recording medium for recording program
JPH10307847A (en) * 1997-02-28 1998-11-17 Fujitsu Ltd Similar case selecting method, its device and recording medium
JP2000215316A (en) * 1999-01-27 2000-08-04 Toshiba Corp Device and method for recognizing biological information
JP2002183206A (en) * 2000-12-15 2002-06-28 Mitsubishi Electric Corp Method and device for retrieving similar object
JP2006338373A (en) * 2005-06-02 2006-12-14 Toshiba Corp Multivariable time series data analyzing apparatus, method, and program
JP2007172077A (en) * 2005-12-19 2007-07-05 Fuji Xerox Co Ltd Image search system, method thereof, and program thereof
JP2009245315A (en) * 2008-03-31 2009-10-22 Kddi Corp Similar image retrieval method and device
US20100191769A1 (en) * 2005-07-21 2010-07-29 Fuji Xerox Co., Ltd. Image search system, image search method, and storage medium

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240716A (en) * 1997-02-21 1998-09-11 Nec Corp Device for analyzing time sequential data and machine readable recording medium for recording program
JPH10307847A (en) * 1997-02-28 1998-11-17 Fujitsu Ltd Similar case selecting method, its device and recording medium
JP2000215316A (en) * 1999-01-27 2000-08-04 Toshiba Corp Device and method for recognizing biological information
JP2002183206A (en) * 2000-12-15 2002-06-28 Mitsubishi Electric Corp Method and device for retrieving similar object
JP2006338373A (en) * 2005-06-02 2006-12-14 Toshiba Corp Multivariable time series data analyzing apparatus, method, and program
US20100191769A1 (en) * 2005-07-21 2010-07-29 Fuji Xerox Co., Ltd. Image search system, image search method, and storage medium
JP2007172077A (en) * 2005-12-19 2007-07-05 Fuji Xerox Co Ltd Image search system, method thereof, and program thereof
JP2009245315A (en) * 2008-03-31 2009-10-22 Kddi Corp Similar image retrieval method and device

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015089163A (en) * 2013-10-28 2015-05-07 パナソニックIpマネジメント株式会社 Behavior evaluation device, behavior evaluation system, behavior evaluation method, and program
JP2016024619A (en) * 2014-07-18 2016-02-08 富士通株式会社 Information processing method, information processing device and information processing program
US10223069B2 (en) 2015-01-22 2019-03-05 Mitsubishi Electric Corporation Time-series data search device and computer readable medium
JP2017211772A (en) * 2016-05-24 2017-11-30 株式会社日立製作所 Adverse effect analysis system, and adverse effect analysis method
JP2020086843A (en) * 2018-11-22 2020-06-04 株式会社エクセディ Data analysis device, data analysis method, control program, and recording medium
JP2020149466A (en) * 2019-03-14 2020-09-17 株式会社日立製作所 System and method for monitoring time-series data
JP7030072B2 (en) 2019-03-14 2022-03-04 株式会社日立製作所 Time-series data monitoring system and time-series data monitoring method

Also Published As

Publication number Publication date
JP5711171B2 (en) 2015-04-30

Similar Documents

Publication Publication Date Title
JP5711171B2 (en) Data search device, data search method, and data search program
JP6070956B2 (en) Similarity detection apparatus and directivity vicinity detection method
Yagoubi et al. Dpisax: Massively distributed partitioned isax
CN103218404B (en) A kind of multi-dimensional metadata management method based on associate feature and system
JP2013519138A (en) Join embedding for item association
CN102915347A (en) Distributed data stream clustering method and system
CN102799614B (en) Image search method based on space symbiosis of visual words
KR101906859B1 (en) Aparatus and method for detecting anomalous subsequence
JP5632862B2 (en) Data search device, data search method, and data search program
JP5014479B2 (en) Image search apparatus, image search method and program
JP2012079187A (en) Feature vector generating device, feature vector generating method and program therefor
Louhichi et al. Unsupervised varied density based clustering algorithm using spline
Yadamjav et al. Querying recurrent convoys over trajectory data
Sun et al. On efficient aggregate nearest neighbor query processing in road networks
Pobiedina et al. Predicting citation counts for academic literature using graph pattern mining
JP2004118290A (en) Device and method for generating index for moving locus data retrieval, device and method for retrieving moving locus data, index generating program for moving locus data retrieval, recording medium recording the same, moving locus data retrieval program and recording medium recording the same
CN103336963A (en) Method and device for image feature extraction
CN111177190B (en) Data processing method, device, electronic equipment and readable storage medium
JP2022074880A5 (en)
CN103309951A (en) Method and device for searching multimedia file on the net
JP7121706B2 (en) Information processing device, information processing method, and information processing program
Huang et al. Processing continuous K-nearest skyline query with uncertainty in spatio-temporal databases
US20140232726A1 (en) Space-filling curve processing system, space-filling curve processing method, and program
Kryszkiewicz et al. A neighborhood-based clustering by means of the triangle inequality
JP5909199B2 (en) Address resolution system and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140305

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141007

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150305

R150 Certificate of patent or registration of utility model

Ref document number: 5711171

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150