JP2001202383A - Device and method for mining data and recording medium - Google Patents

Device and method for mining data and recording medium

Info

Publication number
JP2001202383A
JP2001202383A JP2000013406A JP2000013406A JP2001202383A JP 2001202383 A JP2001202383 A JP 2001202383A JP 2000013406 A JP2000013406 A JP 2000013406A JP 2000013406 A JP2000013406 A JP 2000013406A JP 2001202383 A JP2001202383 A JP 2001202383A
Authority
JP
Japan
Prior art keywords
point
label value
time
medium
medium transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2000013406A
Other languages
Japanese (ja)
Inventor
Susumu Shiraishi
將 白石
Akisumi Mitsuishi
彰純 三石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2000013406A priority Critical patent/JP2001202383A/en
Publication of JP2001202383A publication Critical patent/JP2001202383A/en
Abandoned legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a device and a method for mining data and a recording medium for extracting time correlation rules except for rules with no dependent relation because of a limitation based on the time of transmission between spots by extracting the pattern of a label value to highly frequently appear from the time sequential data of label values acquired at plural spots of a space while considering time for an influence to propagate between spots. SOLUTION: A calculation means 3 calculates a respective distance between respective spots on the basis of spatial information held in a map information holding means and calculates the time of medium transmission between spots by dividing the distance between the spots with a medium transmission velocity. Then, a high frequency label value set is extracted from the time sequential data of label values held in a label value sequence holding means 8 by an inter- label value limitation deciding means 7 and label value pair generating means 9 to rule extracting means 15 while considering the time of medium transmission between spots and on the basis of the high frequency label value set, the rules of if-then form are generated.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明はデータベースにお
いて高頻度で出現するパターンを検出して相関ルールを
抽出するためのデータマイニング装置、データマイニン
グ方法および記録媒体に関し、特に、空間中の複数地点
において1つまたは複数の測定要素に関するラベル値の
時系列を記録したデータベースからの相関ルールの抽出
に好適なデータマイニング装置、データマイニング方法
および記録媒体に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a data mining apparatus, a data mining method, and a recording medium for detecting a pattern appearing in a database at a high frequency and extracting an association rule. The present invention relates to a data mining apparatus, a data mining method, and a recording medium suitable for extracting a correlation rule from a database that records a time series of label values for one or a plurality of measurement elements.

【0002】[0002]

【従来の技術】大規模データベースから知識発見を行う
技術であるデータマイニングの一方法として、相関ルー
ルの抽出がある。相関ルールは、各レコードが品目の集
合で構成されるようなデータベースなどを対象として抽
出される。相関ルールとは、「Aが生起する場合にBも
生起する場合が多い」ことを示す「A→B」なる形式の
ルールのことである。
2. Description of the Related Art As one method of data mining, which is a technique for finding knowledge from a large-scale database, there is extraction of an association rule. The association rules are extracted from a database or the like in which each record is configured by a set of items. The association rule is a rule of the form “A → B” indicating that “when A occurs, B often occurs”.

【0003】第1の従来のデータマイニング方法では、
例えば「Fast Algorithms for Mining Association Rul
es」(Agrawalら著、Proc. of the 20th VLDB C
onference, Santiago, Chile、1994年)や特開平8
−287106号公報に記載のアプリオリ(Apriori )
法に基づいて、データベースに記録された複数のレコー
ドからそのデータベースの品目セット間の相関ルールが
抽出される。アプリオリ法では、すべてのレコードのう
ち品目セット「A,B,・・・,X,Y」の含まれるレ
コードの割合を支持度とし、ルール「A,B,・・・,
X→Y」の条件部の品目セット「A,B,・・・,X」
の含まれるレコードのうち結論部の品目「Y」の含まれ
るレコードの割合を確信度として、これらの支持度およ
び確信度がそれぞれ所定の基準値より高い場合に、ルー
ル「A,B,・・・,X→Y」が相関ルールとして抽出
される。
[0003] In the first conventional data mining method,
For example, "Fast Algorithms for Mining Association Rul
es "(Agrawall et al., Proc. of the 20th VLDB C
onference, Santiago, Chile, 1994)
-Apriori described in Japanese Patent No. 287106
Based on the law, the correlation rules between the item sets in the database are extracted from the plurality of records recorded in the database. In the apriori method, the percentage of records that include the item set “A, B,..., X, Y” out of all records is used as the support level, and the rules “A, B,.
Item set “A, B,..., X” in the condition part of “X → Y”
Is defined as a certainty factor, and when the support and the certainty factor are higher than predetermined reference values, respectively, the rules “A, B,... ., X → Y ”is extracted as an association rule.

【0004】また、第2の従来のデータマイニング方法
では、例えば特開平9−34719号公報に記載のよう
に時系列データを記号化した後にルールを抽出すること
により時系列データからif−then形式のルールが
抽出される。この第2の従来のデータマイニング方法で
は、時系列データと記号値との対応を格納した記号化用
辞書を予め利用者が用意しておく。そして時系列データ
と記号化用辞書を照合して、1つまたは複数の時系列デ
ータを、時刻を付与した記号値の集合に変換する。その
記号値列に基づいて記号値の組み合わせを条件部とする
if−then形式のルールが抽出される。
In the second conventional data mining method, for example, as described in Japanese Patent Application Laid-Open No. 9-34719, a time-series data is symbolized and then rules are extracted to convert the time-series data into an if-then format. Are extracted. In the second conventional data mining method, a user prepares a symbolization dictionary in which correspondence between time-series data and symbol values is stored in advance. Then, the time-series data is collated with the symbolization dictionary, and one or a plurality of time-series data is converted into a set of symbol values to which time is added. Based on the symbol value sequence, an if-then format rule that uses a combination of symbol values as a condition part is extracted.

【0005】さらに、第3の従来のデータマイニング方
法では、例えば「Searching for Structure in Multipl
e Streams of Data 」(Oatesら著、Proc. of the
13th Int'l Conference on Machine Learning、199
6年)に記載されているMSDD(Multi-Stream Depen
dency Detection )法に従って、カテゴリカルデータ
(以下、「ラベル値」という)で構成される複数の時系
列データから、ラベル値のパターン間の時間的な依存関
係が抽出される。MSDD法では、「パターンxが時刻
tに発生すれば、パターンyが確率pで時刻t+dに発
生する」という形式のルールが得られる。図21はMS
DD法の対象になるデータの一例を示す図であり、図2
2は図21に示すデータからMSDD法により抽出され
るルールの一例を示す図である。図21に示すデータは
3つの離散時系列のデータであり、このデータをMSD
D法に従って処理することにより、例えば図22に示す
ルールが抽出される。図22に示すルールは「時刻tに
おいて時系列1でラベル値A、時系列3でラベル値7が
発生し、かつ時刻t+1において時系列2でラベル値W
が発生すれば、時刻t+3において時系列2でラベル値
W、時系列3でラベル値3が発生する」ことが高い確率
で期待されることを意味する。
[0005] Furthermore, in the third conventional data mining method, for example, "Searching for Structure in Multipl
e Streams of Data "(Oates et al., Proc. of the
13th Int'l Conference on Machine Learning, 199
6 years) MSDD (Multi-Stream Depen)
According to the dency detection method, temporal dependency between label value patterns is extracted from a plurality of time-series data composed of categorical data (hereinafter, referred to as “label values”). In the MSDD method, a rule of the form "a pattern y occurs at time t + d with a probability p if a pattern x occurs at time t" is obtained. FIG. 21 shows MS
FIG. 2 is a diagram showing an example of data to be subjected to the DD method, and FIG.
FIG. 2 is a diagram showing an example of a rule extracted from the data shown in FIG. 21 by the MSDD method. The data shown in FIG. 21 is data of three discrete time series.
By processing according to the D method, for example, the rules shown in FIG. 22 are extracted. The rule shown in FIG. 22 is that “a label value A occurs in time series 1 at time t, a label value 7 occurs in time series 3, and a label value W occurs in time series 2 at time t + 1.
Occurs, it is expected that at time t + 3, a label value W occurs in the time series 2 and a label value 3 occurs in the time series 3 ”with high probability.

【0006】[0006]

【発明が解決しようとする課題】従来のデータマイニン
グ方法は以上のように構成されているので、第1の従来
のデータマイニング方法では、属性値の時間的変化を扱
うことは考慮されていないためラベル値の時系列データ
から時間的な相関ルールを得ることが困難であるなどの
課題があり、また、第2および第3の従来のデータマイ
ニング方法では、時系列データが空間の異なる地点で取
得され各地点におけるデータが他の地点におけるデータ
に影響を与える伝達時間を無視できない場合に、そのよ
うな時系列データの依存性を考慮してルールを抽出する
ことが困難であり、地点間の伝達時間による制約のため
に依存関係がないルールまでも抽出されてしまう可能性
があるなどの課題があった。
Since the conventional data mining method is configured as described above, the first conventional data mining method does not consider dealing with the temporal change of the attribute value. There is a problem that it is difficult to obtain a temporal correlation rule from the time-series data of the label value. In the second and third conventional data mining methods, the time-series data is obtained at different points in space. When the transmission time at which data at each point affects data at other points cannot be ignored, it is difficult to extract rules taking into account the dependence of such time-series data. There is a problem that even rules without dependencies may be extracted due to time constraints.

【0007】この発明は上記のような課題を解決するた
めになされたもので、空間の複数地点で取得されたラベ
ル値の時系列データから、地点間を影響が伝達する時間
を考慮して高頻度で出現するラベル値のパターンを抽出
して、地点間の伝達時間による制約のために依存関係が
ないルールを除いて時間的な相関ルールを抽出するため
のデータマイニング装置、データマイニング方法および
記録媒体を得ることを目的とする。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problem, and is based on time-series data of label values acquired at a plurality of points in space, taking into account the time required for transmitting influence between points. Data mining apparatus, data mining method, and recording for extracting patterns of label values appearing at a frequency and extracting temporal correlation rules excluding rules that have no dependency due to restrictions due to transmission time between points The purpose is to obtain a medium.

【0008】[0008]

【課題を解決するための手段】この発明に係るデータマ
イニング装置は、媒体が空間内を移動する速度である媒
体伝達速度の範囲とその各範囲を代表する代表媒体伝達
速度との対応関係に基づいて、媒体伝達速度の時系列で
ある媒体伝達速度系列を構成する各媒体伝達速度を代表
媒体伝達速度に変換して代表媒体伝達速度系列を生成す
る媒体速度分類手段と、各地点の空間的情報および代表
媒体伝達速度に基づいて、各地点対の2地点を第1の地
点および第2の地点として第1の地点から第2の地点へ
媒体が移動する時間および第2の地点から第1の地点へ
媒体が移動する時間をそれぞれ地点間媒体伝達時間とし
て計算する計算手段と、高頻度ラベル値組候補を構成す
るラベル値のうちの時間的に最後のラベル値と残りのラ
ベル値のうちの1つとで構成される2ラベル値組の時間
的に前側のラベル値を前側ラベル値とし時間的に後側の
ラベル値を後側ラベル値として、すべての前側ラベル値
に関して、前側ラベル値の出現時点と後側ラベル値の出
現時点との時間差が前側ラベル値の出現時点での前側ラ
ベル値の出現地点から後側ラベル値の出現地点への地点
間媒体伝達時間以上であるという制約条件を満たすか否
かを判定するラベル値間制約判定手段と、媒体に依存す
る1つまたは複数の要素に関するラベル値の時系列であ
るラベル値系列での各高頻度ラベル値候補の出現頻度を
カウントし、ラベル値間制約判定手段により制約条件を
満たすと判定された場合にのみラベル値系列での各高頻
度ラベル値組候補の出現頻度をカウントするラベル値組
検証手段と、出現頻度が所定の下限値以上である高頻度
ラベル値候補または高頻度ラベル値組候補をそれぞれ高
頻度ラベル値または高頻度ラベル値組とする高頻度ラベ
ル値組抽出手段と、2つの高頻度ラベル値を第1のラベ
ル値および第2のラベル値として組み合わせたラベル値
組のうち、第1のラベル値の出現時点と第2のラベル値
の出現時点との時間差が第1のラベル値の出現時点での
第1のラベル値の出現地点と第2のラベル値の出現地点
との間の地点間媒体伝達時間以上でありかつ所定の最大
伝達時間以下であり、さらにラベル値系列に出現するも
のを高頻度ラベル値組候補とするラベル値対生成手段
と、複数の異なる高頻度ラベル値組を組み合わせて新た
な高頻度ラベル値組候補を生成する高頻度ラベル値組候
補生成手段とを備えるものである。
A data mining apparatus according to the present invention is based on a correspondence between a range of a medium transmission speed which is a speed at which a medium moves in a space and a representative medium transmission speed representing each range. Medium speed classification means for converting each medium transmission speed constituting a medium transmission speed sequence which is a time series of medium transmission speeds into a representative medium transmission speed to generate a representative medium transmission speed sequence; and spatial information of each point. And the representative medium transmission speed, with the two points of each point pair as the first point and the second point, the time that the medium moves from the first point to the second point, and the first point from the second point. Calculating means for calculating the time required for the medium to move to the point as a medium-to-point medium transmission time; 1 The label value on the temporally front side of the two label value set consisting of Whether the time difference between the current label value and the current time of the rear label value is equal to or greater than the inter-point medium transmission time from the current position of the previous label value to the current position of the rear label value at the current time of the previous label value Label-value constraint determining means for determining whether or not each of the high-frequency label value candidates appears in a label value series which is a time series of label values relating to one or more elements depending on a medium; A label value set verification unit that counts the appearance frequency of each high-frequency label value set candidate in the label value series only when it is determined that the constraint condition is satisfied by the inter-value constraint determination unit; A high-frequency label value set extracting means for setting the high-frequency label value candidates or the high-frequency label value set candidates to a high-frequency label value or a high-frequency label value set, respectively; And the time difference between the present time of the first label value and the present time of the second label value in the label value set combined as the second label value is the first label at the present time of the first label value. A high-frequency label value set candidate that is longer than the inter-point medium transmission time between the point of appearance of the value and the point of appearance of the second label value and less than or equal to the predetermined maximum transmission time, and which further appears in the label value series. And a high-frequency label value set candidate generating means for generating a new high-frequency label value set candidate by combining a plurality of different high-frequency label value sets.

【0009】この発明に係るデータマイニング装置は、
高頻度ラベル値組を構成するラベル値のうち時間的に最
後のラベル値を結論部とし残りのラベル値を条件部とす
るルール候補のうち、ラベル値系列での条件部の出現頻
度とその高頻度ラベル値組の出現頻度との比が所定の範
囲にあるものをルールとして抽出するルール抽出手段を
備えるようにしたものである。
[0009] The data mining apparatus according to the present invention comprises:
Of the rule candidates with the temporally last label value as the conclusion part and the remaining label values as the condition parts among the label values that make up the frequent label value set, the frequency of appearance of the condition part in the label value series and its high A rule extracting means for extracting, as a rule, a rule whose ratio with the frequency of appearance of the frequency label value set is within a predetermined range is provided.

【0010】この発明に係るデータマイニング装置は、
地点の空間的情報に基づいて第1の地点と第2の地点と
の間の距離を地点間距離として計算する距離算出手段
と、第1の地点を起点として第2の地点を通る半直線と
代表媒体伝達速度の向きとのなす角度を角度差として計
算する角度差算出手段と、距離算出手段により計算され
た地点間距離、代表媒体伝達速度、および角度差算出手
段により計算された角度差に基づいて地点間媒体伝達時
間を計算する媒体伝達時間算出手段とを計算手段に有す
るものである。
[0010] The data mining apparatus according to the present invention comprises:
Distance calculating means for calculating a distance between the first point and the second point based on spatial information of the point as a point-to-point distance; and a half-line passing through the second point from the first point. Angle difference calculation means for calculating the angle between the direction of the representative medium transmission speed as the angle difference, and the point-to-point distance calculated by the distance calculation means, the representative medium transmission speed, and the angle difference calculated by the angle difference calculation means. Medium transmission time calculating means for calculating the point-to-point medium transmission time on the basis of the calculation means.

【0011】この発明に係るデータマイニング装置は、
距離算出手段により、空間的情報としての各地点の緯度
と経度から地点間の距離を計算するようにしたものであ
る。
[0011] The data mining apparatus according to the present invention comprises:
The distance calculating means calculates the distance between the points from the latitude and longitude of each point as spatial information.

【0012】この発明に係るデータマイニング装置は、
距離算出手段により、空間的情報としての各地点の緯
度、経度および高度から地点間の距離を計算するように
したものである。
[0012] The data mining apparatus according to the present invention comprises:
The distance calculating means calculates the distance between the points from the latitude, longitude and altitude of each point as spatial information.

【0013】この発明に係るデータマイニング装置は、
角度差算出手段により計算された角度差が所定の範囲内
に存在するか否かに応じて第1の地点から第2の地点へ
媒体が移動するか否か、および第2の地点から第1の地
点へ媒体が移動するか否かを判定する角度差判定手段
と、第1の地点から第2の地点へ媒体が移動すると判定
された場合には距離算出手段により計算された地点間距
離と代表媒体伝達速度との比を第1の地点から第2の地
点への地点間媒体伝達時間として計算し、第1の地点か
ら第2の地点へ媒体が移動しないと判定された場合には
第1の地点から第2の地点への地点間媒体伝達時間を所
定の大きな値とし、第2の地点から第1の地点へ媒体が
移動すると判定された場合には地点間距離と代表媒体伝
達速度との比を第2の地点から第1の地点への地点間媒
体伝達時間として計算し、第2の地点から第1の地点へ
媒体が移動しないと判定された場合には第2の地点から
第1の地点への地点間媒体伝達時間を所定の大きな値と
する距離対媒体速度比算出手段とを媒体伝達時間算出手
段に有するものである。
[0013] The data mining apparatus according to the present invention comprises:
Whether the medium moves from the first point to the second point according to whether the angle difference calculated by the angle difference calculating means is within a predetermined range, and whether the medium moves from the second point to the first point. Angle difference determining means for determining whether or not the medium moves to the point, and the point-to-point distance calculated by the distance calculating means when the medium is determined to move from the first point to the second point. The ratio with the representative medium transmission speed is calculated as the point-to-point medium transmission time from the first point to the second point, and if it is determined that the medium does not move from the first point to the second point, The point-to-point medium transmission time from the first point to the second point is set to a predetermined large value, and when it is determined that the medium moves from the second point to the first point, the point-to-point distance and the representative medium transmission speed Is measured as the point-to-point medium transmission time from the second point to the first point. If it is determined that the medium does not move from the second point to the first point, the distance-to-medium speed is set to a predetermined large value for the point-to-point medium transmission time from the second point to the first point. And a ratio calculating means in the medium transmission time calculating means.

【0014】この発明に係るデータマイニング装置は、
代表媒体伝達速度の、第1の地点と第2の地点を結ぶ直
線の方向の成分を距離方向速度として計算する距離方向
速度算出手段と、第1の地点を起点として第2の地点を
通る半直線と距離方向速度の向きとが一致している場合
には地点間距離と距離方向速度の大きさとの比を第1の
地点から第2の地点への地点間媒体伝達時間として計算
し、半直線と距離方向速度の向きとが一致していない場
合には第1の地点から第2の地点への地点間媒体伝達時
間を所定の大きな値とし、第2の地点を起点として第1
の地点を通る半直線と距離方向速度の向きとが一致して
いる場合には地点間距離と距離方向速度の大きさとの比
を第2の地点から第1の地点への地点間媒体伝達時間と
して計算し、半直線と距離方向速度の向きとが一致して
いない場合には第2の地点から第1の地点への地点間媒
体伝達時間を所定の大きな値とする距離対媒体速度比算
出手段とを媒体伝達時間算出手段に有するものである。
[0014] The data mining apparatus according to the present invention comprises:
A distance direction speed calculating means for calculating, as a distance direction speed, a component of a representative medium transmission speed in a direction of a straight line connecting the first point and the second point, and a half passing through the second point starting from the first point. When the direction of the straight line and the direction of the distance direction match, the ratio of the distance between the points and the magnitude of the distance direction speed is calculated as the point-to-point medium transmission time from the first point to the second point, and When the direction of the straight line does not match the direction of the distance direction speed, the point-to-point medium transmission time from the first point to the second point is set to a predetermined large value, and the first point is set with the second point as a starting point.
When the direction of the semi-straight line passing through the point and the direction of the distance direction velocity coincide, the ratio of the distance between the points and the magnitude of the distance direction velocity is determined by the medium transmission time between points from the second point to the first point. When the direction of the semi-straight line does not match the direction of the distance direction speed, the distance-to-medium speed ratio calculation that sets the point-to-point medium transmission time from the second point to the first point to a predetermined large value Means in the medium transmission time calculating means.

【0015】この発明に係るデータマイニング装置は、
媒体伝達速度系列が各地点毎に得られている場合に、各
地点対の2地点にそれぞれ対応する2つの媒体伝達速度
系列から地点間代表速度系列を計算する地点間代表速度
系列算出手段を備え、媒体速度分類手段が媒体伝達速度
系列の代わりに地点間代表速度系列を使用するようにし
たものである。
[0015] The data mining apparatus according to the present invention comprises:
A point-to-point representative speed sequence calculating means for calculating a point-to-point representative speed sequence from two medium transmission speed sequences respectively corresponding to two points of each point pair when the medium transmission speed sequence is obtained for each point; The medium speed classification means uses a point-to-point representative speed sequence instead of the medium transmission speed sequence.

【0016】この発明に係るデータマイニング装置は、
媒体伝達速度系列を構成する各時点における媒体伝達速
度を、その媒体伝達速度およびその近傍の1つまたは複
数の時点における媒体伝達速度の平均に変換して媒体伝
達速度系列を平滑化媒体伝達速度系列に変換する媒体速
度系列平滑化手段を備え、媒体速度分類手段が媒体伝達
速度系列の代わりに媒体速度系列平滑化手段により変換
された平滑化媒体伝達速度系列を使用するようにしたも
のである。
[0016] The data mining apparatus according to the present invention comprises:
The medium transmission speed at each time point constituting the medium transmission speed sequence is converted into an average of the medium transmission speed and the medium transmission speed at one or more time points near the medium transmission speed, and the medium transmission speed sequence is smoothed. And a medium velocity class smoothing means for converting the medium velocity series to the medium velocity series. The medium velocity classification means uses the smoothed medium transmission velocity series converted by the medium velocity series smoothing means instead of the medium transmission velocity series.

【0017】この発明に係るデータマイニング装置は、
ラベル値系列のうち所定の時間幅に含まれる部分系列を
ラベル値部分系列として抽出するラベル値部分系列抽出
手段と、ラベル値部分系列の最初の時点におけるラベル
値が高頻度ラベル値である場合にそのラベル値を第1の
高頻度ラベル値とする高頻度ラベル値検出手段と、第1
の高頻度ラベル値の出現時点での、第1の高頻度ラベル
値の出現地点を起点とした場合の地点間媒体伝達時間が
所定の最大伝達時間以下である地点を伝達時間制約満足
地点として抽出する地点抽出手段と、ラベル値部分系列
における伝達時間制約満足地点に関するラベル値のう
ち、ラベル値部分系列の最初の時点からその地点に対応
する地点間媒体伝達時間以降のラベル値であり、かつ高
頻度ラベル値であるラベル値を第2の高頻度ラベル値と
し、第1の高頻度ラベル値および第2の高頻度ラベル値
で高頻度ラベル値組候補を生成するラベル値対抽出手段
とをラベル値対生成手段に有するものである。
[0017] The data mining apparatus according to the present invention comprises:
A label value subsequence extracting means for extracting a subsequence included in a predetermined time width from the label value series as a label value subsequence, and a method in which the label value at the first time point of the label value subsequence is a high frequency label value. A high-frequency label value detecting unit that uses the label value as a first high-frequency label value;
Is extracted as a transmission time constraint satisfaction point when the point-to-point medium transmission time is less than or equal to a predetermined maximum transmission time when the point of appearance of the first high frequency label value at the present time is the origin. And a label value relating to the transmission time constraint satisfying point in the label value subsequence, the label value from the first time point of the label value subsequence to the interpoint medium transmission time corresponding to that point, and A label value that is a frequency label value is set as a second high frequency label value, and a label value pair extraction unit that generates a high frequency label value set candidate with the first high frequency label value and the second high frequency label value is labeled. This is provided in the value pair generation means.

【0018】この発明に係るデータマイニング装置は、
ラベル値部分系列抽出手段によるラベル値部分系列から
予め指定された要素に対応するものを抽出する要素指定
抽出手段をラベル値対生成手段に有し、ラベル値対抽出
手段がラベル値部分系列抽出手段によるラベル値部分系
列の代わりに要素指定抽出手段により抽出された系列を
使用するようにしたものである。
[0018] The data mining apparatus according to the present invention comprises:
The label value pair generating means includes an element designation extracting means for extracting an element corresponding to an element designated in advance from the label value partial series by the label value partial series extracting means, and the label value pair extracting means comprises a label value partial sequence extracting means. Are used instead of the label value subsequences described above.

【0019】この発明に係るデータマイニング装置は、
地点抽出手段が所定の無相関地点対のうち第1の高頻度
ラベル値の出現地点を含むものを検出し、無相関地点対
のうちの第1の高頻度ラベル値の出現地点でない地点を
伝達時間制約満足地点から削除するようにしたものであ
る。
The data mining device according to the present invention comprises:
The point extracting means detects a point including an appearance point of the first high-frequency label value among the predetermined non-correlation point pairs, and transmits a point of the non-correlation point pair that is not the appearance point of the first high-frequency label value. It is deleted from the time constraint satisfaction point.

【0020】この発明に係るデータマイニング方法は、
媒体が空間内を移動する速度である媒体伝達速度の範囲
とその各範囲を代表する代表媒体伝達速度との対応関係
に基づいて、媒体伝達速度の時系列である媒体伝達速度
系列を構成する各媒体伝達速度を代表媒体伝達速度に変
換して代表媒体伝達速度系列を生成するステップと、2
つの地点の空間的情報および各代表媒体伝達速度に基づ
いて、2つの地点を第1の地点および第2の地点とし
て、第1の地点から第2の地点へ媒体が移動する時間お
よび第2の地点から第1の地点へ媒体が移動する時間を
それぞれ地点間媒体伝達時間として計算するステップ
と、媒体に依存する1つまたは複数の要素に関するラベ
ル値の時系列であるラベル値系列での各高頻度ラベル値
候補の出現頻度をカウントするステップと、出現頻度が
所定の下限値以上である高頻度ラベル値候補を高頻度ラ
ベル値とするステップと、2つの高頻度ラベル値を第1
のラベル値および第2のラベル値として組み合わせたラ
ベル値組のうち、第1のラベル値の出現時点と第2のラ
ベル値の出現時点との時間差が第1のラベル値の出現時
点での第1のラベル値の出現地点と第2のラベル値の出
現地点との間の地点間媒体伝達時間以上でありかつ所定
の最大伝達時間以下であり、さらにラベル値系列に出現
するものを高頻度ラベル値組候補とするステップと、高
頻度ラベル値組候補を構成するラベル値のうちの時間的
に最後のラベル値と残りのラベル値のうちの1つとで構
成される2ラベル値組の時間的に前側のラベル値を前側
ラベル値とし時間的に後側のラベル値を後側ラベル値と
して、すべての前側ラベル値に関して、前側ラベル値の
出現時点と後側ラベル値の出現時点との時間差が前側ラ
ベル値の出現時点での前側ラベル値の出現地点から後側
ラベル値の出現地点への地点間媒体伝達時間以上である
という制約条件を満たすか否かを判定するステップと、
ラベル値系列での各高頻度ラベル値組候補の出現頻度を
その制約条件を満たすと判定された場合にのみカウント
するステップと、出現頻度が所定の下限値以上である高
頻度ラベル値組候補を高頻度ラベル値組とするステップ
と、複数の異なる高頻度ラベル値組を組み合わせて新た
な高頻度ラベル値組候補を生成するステップとを備える
ものである。
[0020] The data mining method according to the present invention comprises:
Based on the correspondence between the range of the medium transmission speed, which is the speed at which the medium moves in the space, and the representative medium transmission speed that represents each range, each of the media transmission speed series, which is a time series of the medium transmission speed, is formed. Converting the medium transmission speed to a representative medium transmission speed to generate a representative medium transmission speed sequence;
Based on the spatial information of the two points and each representative medium transmission speed, the time taken for the medium to move from the first point to the second point and the second point are defined as the two points as a first point and a second point. Calculating the time required for the medium to move from the point to the first point as a point-to-point medium transmission time; and calculating each time in a label value series that is a time series of label values for one or more elements depending on the medium. Counting the frequency of appearance of the frequency label value candidates; setting the high frequency label value candidates whose appearance frequency is equal to or higher than a predetermined lower limit value to the high frequency label value;
Of the label value pair combined as the first label value and the second label value, the time difference between the present time of the first label value and the present time of the second label value is the second label value. Labels which are longer than the point-to-point medium transmission time between the point of appearance of the first label value and the point of appearance of the second label value and less than or equal to the predetermined maximum transmission time, and which appear in the label value series are labeled as high-frequency labels. A value set candidate, and a temporally two label value set composed of a temporally last label value and one of the remaining label values of the label values constituting the frequent label value set candidate The label value on the front side is used as the front label value and the label value on the back side is used as the rear label value. Output time of front label value Determining whether the constraint condition that is the front label value occurrence point point-to-point medium transmission time over the emergence point of the rear label value from,
Counting the occurrence frequency of each high-frequency label value set candidate in the label value series only when it is determined that the constraint condition is satisfied; The method includes a step of setting a high-frequency label value set and a step of generating a new high-frequency label value set candidate by combining a plurality of different high-frequency label value sets.

【0021】この発明に係る記録媒体は、媒体が空間内
を移動する速度である媒体伝達速度の範囲とその各範囲
を代表する代表媒体伝達速度との対応関係に基づいて、
媒体伝達速度の時系列である媒体伝達速度系列を構成す
る各媒体伝達速度を代表媒体伝達速度に変換して代表媒
体伝達速度系列を生成する媒体速度分類手段、各地点の
空間的情報および代表媒体伝達速度に基づいて、各地点
対の2地点を第1の地点および第2の地点として第1の
地点から第2の地点へ媒体が移動する時間および第2の
地点から第1の地点へ媒体が移動する時間をそれぞれ地
点間媒体伝達時間として計算する計算手段、高頻度ラベ
ル値組候補を構成するラベル値のうちの時間的に最後の
ラベル値と残りのラベル値のうちの1つとで構成される
2ラベル値組の時間的に前側のラベル値を前側ラベル値
とし時間的に後側のラベル値を後側ラベル値として、す
べての前側ラベル値に関して、前側ラベル値の出現時点
と後側ラベル値の出現時点との時間差が前側ラベル値の
出現時点での、前側ラベル値の出現地点から後側ラベル
値の出現地点への地点間媒体伝達時間以上であるという
制約条件を満たすか否かを判定するラベル値間制約判定
手段、媒体に依存する1つまたは複数の要素に関するラ
ベル値の時系列であるラベル値系列での各高頻度ラベル
値候補の出現頻度をカウントし、ラベル値間制約判定手
段により制約条件を満たすと判定された場合にのみラベ
ル値系列での各高頻度ラベル値組候補の出現頻度をカウ
ントするラベル値組検証手段、出現頻度が所定の下限値
以上である高頻度ラベル値候補または高頻度ラベル値組
候補をそれぞれ高頻度ラベル値または高頻度ラベル値組
とする高頻度ラベル値組抽出手段、2つの高頻度ラベル
値を第1のラベル値および第2のラベル値として組み合
わせたラベル値組のうち、第1のラベル値の出現時点と
第2のラベル値の出現時点との時間差が第1のラベル値
の出現時点での第1のラベル値の出現地点と第2のラベ
ル値の出現地点との間の地点間媒体伝達時間以上であり
かつ所定の最大伝達時間以下であり、さらにラベル値系
列に出現するものを高頻度ラベル値組候補とするラベル
値対生成手段、並びに、複数の異なる高頻度ラベル値組
を組み合わせて新たな高頻度ラベル値組候補を生成する
高頻度ラベル値組候補生成手段としてコンピュータを機
能させるためのプログラムを記録したものである。
[0021] The recording medium according to the present invention is based on the correspondence between the range of the medium transmission speed, which is the speed at which the medium moves in the space, and the representative medium transmission speed representing each of the ranges.
Medium speed classification means for converting each medium transmission speed constituting a medium transmission speed sequence which is a time series of medium transmission speeds into a representative medium transmission speed to generate a representative medium transmission speed sequence, spatial information of each point, and a representative medium Based on the transmission speed, the time at which the medium travels from the first point to the second point and the medium from the second point to the first point, with the two points of each point pair as a first point and a second point Calculating means for calculating the travel time of each as a medium-to-point medium transmission time, comprising a temporally last label value of label values constituting a high-frequency label value set candidate and one of the remaining label values The label value on the temporally front side of the two label value set to be used is the front label value, and the label value on the temporal side is the rear label value. Label value A label that determines whether or not the time difference from the present time satisfies the constraint condition that the media transfer time from the point of appearance of the front label value to the point of appearance of the rear label value is equal to or longer than the point-to-point medium transmission time at the present time of the preceding label value The inter-value constraint determining means counts the frequency of occurrence of each high-frequency label value candidate in a label value series that is a time series of label values relating to one or more elements depending on the medium, and restricts by the inter-label value constraint determining means. A label value set verification unit that counts the appearance frequency of each high frequency label value set candidate in the label value series only when it is determined that the condition is satisfied, a high frequency label value candidate whose appearance frequency is equal to or more than a predetermined lower limit, or A high-frequency label value set extracting unit that sets the high-frequency label value set candidates as high-frequency label values or high-frequency label value sets, respectively, and the two high-frequency label values as a first label value and a second label value; The time difference between the present time of the first label value and the present time of the second label value in the label value set combined as the first label value is the appearance point of the first label value at the present time of the first label value A label value that is longer than the point-to-point medium transmission time between the second label value and the point of appearance of the second label value and less than or equal to a predetermined maximum transmission time, and that appears in the label value sequence as a high-frequency label value set candidate A pair generating means and a program for causing a computer to function as a high frequency label value set candidate generating means for generating a new high frequency label value set candidate by combining a plurality of different high frequency label value sets. .

【0022】[0022]

【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.図1はこの発明の実施の形態1によるデ
ータマイニング装置の構成を示すブロック図である。図
において、1は各地点の空間的情報を保持する地図情報
保持手段であり、2は媒体が空間内を移動する速度であ
る媒体伝達速度の範囲と各範囲を代表する媒体伝達速度
である代表媒体伝達速度との対応関係を保持する対応関
係保持手段である。なお、例えば気象データの場合、空
気が媒体であり、風速が媒体伝達速度に対応し、湿度な
どは各地点に存在する空気の属性(要素)であり、空気
の移動に伴って変化する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below. Embodiment 1 FIG. FIG. 1 is a block diagram showing a configuration of a data mining device according to Embodiment 1 of the present invention. In the figure, reference numeral 1 denotes map information holding means for holding spatial information of each point, and 2 denotes a medium transmission speed range which is a speed at which the medium moves in space and a medium transmission speed which represents each range. Correspondence holding means for holding the correspondence with the medium transmission speed. In the case of weather data, for example, air is the medium, the wind speed corresponds to the medium transmission speed, the humidity and the like are the attributes (elements) of the air at each point, and change with the movement of the air.

【0023】3は地点の空間的情報および代表媒体伝達
速度に基づいて、各代表媒体伝達速度に対して、各地点
対の2地点を第1の地点および第2の地点として、第1
の地点から第2の地点へ媒体が移動する時間および第2
の地点から第1の地点へ媒体が移動する時間をそれぞれ
地点間媒体伝達時間として計算する計算手段である。
3 is based on the spatial information of the points and the representative medium transmission speed, and for each representative medium transmission speed, the two points of each pair of points are defined as a first point and a second point.
Time the medium travels from the point to the second point and the second
Calculating means for calculating the time required for the medium to move from the point to the first point as the point-to-point medium transmission time.

【0024】計算手段3において、21は第1の地点を
起点として第2の地点を通る半直線と各代表媒体伝達速
度の向きとのなす角度を角度差として計算する角度差算
出手段であり、22は地点の空間的情報に基づいて第1
の地点と第2の地点との間の距離を地点間距離として計
算する距離算出手段であり、23は距離算出手段22に
より計算された地点間距離、代表媒体伝達速度、および
角度差算出手段21により計算された角度差に基づいて
地点間媒体伝達時間を計算する媒体伝達時間算出手段で
ある。媒体伝達時間算出手段23において、24は角度
差算出手段21により計算された角度差が所定の範囲内
に存在するか否かに応じて第1の地点から第2の地点へ
媒体が移動するか否か、および第2の地点から第1の地
点へ媒体が移動するか否かを判定する角度差判定手段で
あり、25は第1の地点から第2の地点へ媒体が移動す
ると判定された場合には距離算出手段22により計算さ
れた地点間距離と代表媒体伝達速度との比を第1の地点
から第2の地点への地点間媒体伝達時間として計算し、
第1の地点から第2の地点へ媒体が移動しないと判定さ
れた場合には第1の地点から第2の地点への地点間媒体
伝達時間を所定の大きな値とし、第2の地点から第1の
地点へ媒体が移動すると判定された場合には地点間距離
と代表媒体伝達速度との比を第2の地点から第1の地点
への地点間媒体伝達時間として計算し、第2の地点から
第1の地点へ媒体が移動しないと判断された場合には第
2の地点から第1の地点への地点間媒体伝達時間を所定
の大きな値とする距離対媒体速度比算出手段である。な
お、所定の大きな値とは、実際に地点間媒体伝達時間と
して取り得る値より大きな所定の値である。
In the calculating means 3, an angle difference calculating means 21 calculates an angle formed between a direction of each representative medium transmission speed and a half line passing through the second point from the first point as a starting point, 22 is the first based on the spatial information of the point
23 is a distance calculating means for calculating the distance between the second point and the second point as a point-to-point distance, and 23 is a point-to-point distance calculated by the distance calculating means 22, a representative medium transmission speed, and an angle difference calculating means 21. Is a medium transmission time calculation unit that calculates the point-to-point medium transmission time based on the angle difference calculated by In the medium transmission time calculating means 23, it is determined whether the medium moves from the first point to the second point depending on whether the angle difference calculated by the angle difference calculating means 21 is within a predetermined range. No, and angle difference determination means for determining whether the medium moves from the second point to the first point, and 25 is determined to move the medium from the first point to the second point. In this case, the ratio between the point-to-point distance calculated by the distance calculating means 22 and the representative medium transmission speed is calculated as the point-to-point medium transmission time from the first point to the second point,
When it is determined that the medium does not move from the first point to the second point, the point-to-point medium transmission time from the first point to the second point is set to a predetermined large value, and the second point is transmitted from the second point to the second point. When it is determined that the medium moves to the first point, the ratio between the point-to-point distance and the representative medium transmission speed is calculated as the point-to-point medium transmission time from the second point to the first point, and the second point is calculated. If it is determined that the medium does not move from the second point to the first point, the distance-to-medium speed ratio calculation means sets the point-to-point medium transmission time from the second point to the first point to a predetermined large value. The predetermined large value is a predetermined value that is larger than a value that can be actually taken as the point-to-point medium transmission time.

【0025】4は計算手段3により計算された地点間媒
体伝達時間を保持する媒体伝達時間保持手段であり、5
は媒体伝達速度の時系列である媒体伝達速度系列を保持
する媒体伝達速度系列保持手段であり、6は対応関係保
持手段2に保持された対応関係に基づいて、媒体伝達速
度系列を構成する各媒体伝達速度を代表媒体伝達速度に
変換して代表媒体伝達速度系列を生成する媒体速度分類
手段である。
Reference numeral 4 denotes a medium transmission time holding unit for holding the point-to-point medium transmission time calculated by the calculation unit 3;
Reference numeral 6 denotes a medium transmission speed sequence holding unit that holds a medium transmission speed sequence that is a time series of medium transmission speeds. Reference numeral 6 denotes each of the media transmission speed sequences that form the medium transmission speed sequence based on the correspondence held by the correspondence holding unit 2. This is a medium speed classification unit that converts a medium transmission speed into a representative medium transmission speed and generates a representative medium transmission speed sequence.

【0026】7は高頻度ラベル値組候補を構成するラベ
ル値のうちの時間的に最後のラベル値と残りのラベル値
のうちの1つとで構成される2ラベル値組の時間的に前
側のラベル値を前側ラベル値とし時間的に後側のラベル
値を後側ラベル値として、すべての前側ラベル値に関し
て、前側ラベル値の出現時点と後側ラベル値の出現時点
との時間差が前側ラベル値の出現時点での前側ラベル値
の出現地点から後側ラベル値の出現地点への地点間媒体
伝達時間以上であるという制約条件を満たすか否かを判
定するラベル値間制約判定手段である。
Reference numeral 7 denotes a temporally preceding label of a two-label value set composed of the temporally last label value of the label values constituting the high-frequency label value candidate and one of the remaining label values. Using the label value as the front label value and the temporally rear label value as the rear label value, for all front label values, the time difference between the current time of the front label value and the current time of the rear label value is the front label value. Is an inter-label value constraint judging unit for judging whether or not a constraint condition that the inter-point medium transmission time from the appearance point of the front label value to the appearance point of the rear label value at the present time is equal to or more than the time is satisfied.

【0027】8は媒体に依存する1つまたは複数の要素
に関するラベル値の時系列データであるラベル値系列を
保持するラベル値系列保持手段である。ラベル値とはい
わゆるカテゴリカルデータのことであり、予め定められ
た有限個の値のうちのいずれかを取るデータのことであ
り、ラベル値系列とは、具体的には空間中の複数地点で
計測された温度や湿度等の気象データの時系列などであ
る。ラベル値は媒体に依存するので、媒体の伝達に基づ
いて変化する。また、各地点におけるラベル値は、媒体
の移動だけではなく、その地点における過去のラベル値
にも影響を受けると考えられる。互いに異なる地点Aと
地点Bの場合、地点Aにおけるある時点でのラベル値の
地点Bのラベル値への影響は、地点Aから地点Bへ媒体
が移動する時間が経過した時点以降に存在する。
Reference numeral 8 denotes label value series holding means for holding a label value series which is time-series data of one or a plurality of elements depending on a medium. The label value is so-called categorical data, which is data that takes any one of a predetermined finite number of values, and a label value series is, specifically, at a plurality of points in space. It is a time series of weather data such as measured temperature and humidity. Since the label value depends on the medium, it changes based on the transmission of the medium. In addition, it is considered that the label value at each point is affected not only by the movement of the medium but also by the past label value at that point. In the case of the point A and the point B different from each other, the influence of the label value at the point A at a certain point on the label value at the point B exists after the time when the medium moves from the point A to the point B has elapsed.

【0028】9は2つの高頻度ラベル値を第1のラベル
値および第2のラベル値として組み合わせたラベル値組
のうち、第1のラベル値の出現時点と第2のラベル値の
出現時点との時間差が第1のラベル値の出現時点での第
1のラベル値の出現地点と第2のラベル値の出現地点と
の間の地点間媒体伝達時間以上でありかつ所定の最大伝
達時間以下であり、さらにラベル値系列に出現するもの
を高頻度ラベル値組候補とするラベル値対生成手段であ
る。
Reference numeral 9 denotes a label value set in which two high-frequency label values are combined as a first label value and a second label value, and the first label value and the second label value. Is greater than or equal to the point-to-point medium transmission time between the point of appearance of the first label value and the point of appearance of the second label value at the present time of the first label value, and is equal to or less than the predetermined maximum transmission time. And label value pair generation means that sets a label that appears in the label value series as a high-frequency label value set candidate.

【0029】ラベル値対生成手段9において、31はラ
ベル値系列のうち所定の時間幅に含まれる部分系列をラ
ベル値部分系列として抽出するラベル値部分系列抽出手
段であり、32はラベル値部分系列の最初の時点におけ
るラベル値が高頻度ラベル値である場合にそのラベル値
を第1の高頻度ラベル値とする高頻度ラベル値検出手段
であり、33は第1の高頻度ラベル値の出現時点におけ
る代表媒体伝達速度に関する、第1の高頻度ラベル値の
出現地点を起点とした場合の地点間媒体伝達時間が所定
の最大伝達時間以下である地点を伝達時間制約満足地点
として抽出する地点抽出手段であり、34はラベル値部
分系列における伝達時間制約満足地点に関するラベル値
のうち、ラベル値部分系列の最初の時点からその地点に
対応する地点間媒体伝達時間以降のラベル値であり、か
つ高頻度ラベル値であるラベル値を第2の高頻度ラベル
値とし、第1の高頻度ラベル値および第2の高頻度ラベ
ル値で高頻度ラベル値組候補を生成し、その高頻度ラベ
ル値組候補の出現頻度をカウントするラベル値対抽出手
段である。
In the label value pair generation means 9, reference numeral 31 denotes label value subsequence extracting means for extracting a subsequence included in a predetermined time width from the label value series as a label value subsequence, and 32 denotes a label value subsequence. Is a high-frequency label value detecting means for setting the label value as a first high-frequency label value when the label value at the first point in time is a high-frequency label value. Point extraction means for extracting, as a transmission time constraint satisfaction point, a point whose medium-to-point medium transmission time is less than or equal to a predetermined maximum transmission time when the point of appearance of the first high-frequency label value with respect to the representative medium transmission speed is set as a starting point And 34 is an inter-point medium corresponding to the point from the first time point of the label value subsequence among the label values related to the transmission time constraint satisfaction points in the label value subsequence. A label value that is a label value after the transmission time and that is a high-frequency label value is defined as a second high-frequency label value, and a high-frequency label value set candidate is determined by the first high-frequency label value and the second high-frequency label value. And label value pair extraction means for counting the appearance frequency of the high frequency label value set candidates.

【0030】10はラベル値系列での各高頻度ラベル値
候補の出現頻度をカウントし、ラベル値間制約判定手段
7により制約条件を満たすと判定された場合にのみラベ
ル値系列での各高頻度ラベル値組候補の出現頻度をカウ
ントするラベル値組検証手段である。なお、長さ2の高
頻度ラベル値組候補の出現頻度についてはラベル値対生
成手段9でカウントされるが、ラベル値組検証手段10
でカウントされるようにしてもよい。11は高頻度ラベ
ル値候補または高頻度ラベル値組候補を保持し、ラベル
値対生成手段9またはラベル値組検証手段10によりカ
ウントされた高頻度ラベル値候補または高頻度ラベル値
組候補の出現頻度を保持する高頻度ラベル値組候補管理
手段であり、12は出現頻度が所定の下限値以上である
高頻度ラベル値候補または高頻度ラベル値組候補をそれ
ぞれ高頻度ラベル値または高頻度ラベル値組とする高頻
度ラベル値組抽出手段である。
Numeral 10 counts the frequency of occurrence of each high-frequency label value candidate in the label value series, and only when the label value constraint determining means 7 determines that the constraint condition is satisfied, each high-frequency label value candidate in the label value series is counted. This is a label value set verification unit that counts the appearance frequency of label value set candidates. Note that the appearance frequency of the high-frequency label value set candidate having a length of 2 is counted by the label value pair generation unit 9, but the label value pair verification unit 10
May be counted. Reference numeral 11 denotes a high-frequency label value candidate or a high-frequency label value set candidate, and the appearance frequency of the high-frequency label value candidate or the high-frequency label value set candidate counted by the label value pair generation unit 9 or the label value pair verification unit 10. 12 is a high-frequency label value set candidate management unit, and 12 is a high-frequency label value set or a high-frequency label value set candidate whose appearance frequency is equal to or higher than a predetermined lower limit, respectively. Is a high-frequency label value set extracting means.

【0031】13は高頻度ラベル値組抽出手段12によ
り抽出された高頻度ラベル値または高頻度ラベル値組を
その出現頻度とともに保持する高頻度ラベル値組管理手
段であり、14は複数の異なる高頻度ラベル値組を組み
合わせて新たな高頻度ラベル値組候補を生成するラベル
値組生成手段(高頻度ラベル値組候補生成手段)であ
り、15は高頻度ラベル値組管理手段13に保持された
高頻度ラベル値組からルールを抽出するルール抽出手段
である。
Numeral 13 denotes a high-frequency label value set management means for holding the high-frequency label values or the high-frequency label value sets extracted by the high-frequency label value set extraction means 12 together with their appearance frequencies. Label value set generation means (high frequency label value set candidate generation means) for generating new high frequency label value set candidates by combining frequency label value sets, and 15 is held in the high frequency label value set management means 13 This is a rule extracting means for extracting a rule from a high frequency label value set.

【0032】次に動作について説明する。図2は地点
A,B,Cの一例を示す図であり、図3は媒体伝達速度
系列の一例を示す図であり、図4は地点A,B,Cにお
いて得られたラベル値系列の一例を示す図であり、図5
は媒体伝達速度の各範囲と代表媒体伝達速度との対応関
係の一例を示す図であり、図6は代表媒体伝達速度系列
の一例を示す図であり、図7は2地点による半直線と代
表媒体伝達速度の向きとのなす角度の例を示す図であ
る。地図情報保持手段1は、例えば図2に示す3つの地
点A,B,Cといった各地点の例えば緯度、経度などの
空間的情報を保持する。図2の地点A,B,Cについて
は、地点Cが地点Bの真東の方向に位置し、地点Bは地
点Aの真南の方向に位置する。
Next, the operation will be described. FIG. 2 is a diagram illustrating an example of points A, B, and C, FIG. 3 is a diagram illustrating an example of a medium transmission speed sequence, and FIG. 4 is an example of a label value sequence obtained at points A, B, and C FIG. 5 is a diagram showing
6 is a diagram illustrating an example of a correspondence relationship between each range of the medium transmission speed and the representative medium transmission speed, FIG. 6 is a diagram illustrating an example of a representative medium transmission speed series, and FIG. FIG. 4 is a diagram illustrating an example of an angle between the direction of a medium transmission speed and a direction; The map information holding means 1 holds spatial information such as, for example, latitude and longitude of each point such as three points A, B, and C shown in FIG. With respect to the points A, B, and C in FIG.

【0033】媒体伝達速度系列保持手段5は、例えば図
3に示すように媒体伝達速度系列を保持する。媒体伝達
速度はその大きさと向きで表現され、媒体伝達速度系列
は所定の単位時間毎にサンプリングされた一連の媒体伝
達速度である。図3では単位時間、すなわちサンプリン
グ間隔は600秒(=10分)とする。図3の媒体伝達
速度系列では、最初の時点では真東から反時計回りに1
0度の方向に媒体が移動しており、その移動速度の大き
さが毎秒3メートルであり、以降、媒体の移動方向およ
び大きさが順次変化することが示されている。
The medium transmission speed sequence holding means 5 holds a medium transmission speed sequence, for example, as shown in FIG. The medium transmission speed is represented by its size and direction, and the medium transmission speed sequence is a series of medium transmission speeds sampled at predetermined unit times. In FIG. 3, the unit time, that is, the sampling interval is 600 seconds (= 10 minutes). In the medium transmission speed series shown in FIG.
It is shown that the medium is moving in the direction of 0 degrees, the moving speed is 3 meters per second, and thereafter, the moving direction and the size of the medium are sequentially changed.

【0034】ラベル値系列保持手段8は、例えば図4に
示すように、地図情報保持手段1に保持された各地点に
おいて得られた1つまたは複数の要素に関するラベル値
系列を保持する。図4においては、A,B,Cは図2に
おける地点を表し、各地点に対して1つの要素に関する
ラベル値系列が示されている。なお、気象データの場
合、例えば「温度」や「湿度」などの測定要素の値がラ
ベル値となる。温度や湿度などは通常連続値であるが、
境界値をいくつか設定して連続値をいくつかの領域に分
割して、温度や湿度などの値をラベル値に変換する。な
お、各ラベル値は媒体に依存する。
The label value series holding means 8 holds, for example, as shown in FIG. 4, a label value series concerning one or a plurality of elements obtained at each point held by the map information holding means 1. In FIG. 4, A, B, and C represent points in FIG. 2, and a label value sequence for one element is shown for each point. In the case of weather data, for example, values of measurement elements such as “temperature” and “humidity” are label values. Temperature and humidity are usually continuous values,
Some boundary values are set, continuous values are divided into several regions, and values such as temperature and humidity are converted into label values. Note that each label value depends on the medium.

【0035】すなわち、温度の場合、例えば、−10度
未満をラベル値pとし、−10度以上0度未満をラベル
値qとし、0度以上10度未満をラベル値rとし、10
度以上20度未満をラベル値sとし、20度以上30度
未満をラベル値tとし、30度以上をラベル値uとする
ことにより、連続値である温度の時系列をラベル値p,
q,r,s,t,uのラベル値系列に変換する。
That is, in the case of temperature, for example, a label value p is defined as less than -10 degrees and a label value q is defined as -10 degrees or more and less than 0 degrees, and a label value r is defined as 0 degrees or more and less than 10 degrees.
By setting the label value s to a label value s from 20 degrees to less than 20 degrees as a label value t and a label value u to 30 degrees or more, a time series of temperature as a continuous value is represented by a label value p,
It is converted into a label value series of q, r, s, t, u.

【0036】図4では、A,B,Cの3地点において、
ある時点を起点として所定のサンプリング間隔毎で測定
した所定の要素のラベル値が示されている。今の場合、
この要素が取り得るラベル値はp,q,r,s,t,u
のいずれかである。そして地点Aにおけるラベル値系列
はp,q,r,p,u,r,t,q,sである。なお、
以下では地点を区別する必要がある場合は、地点名を連
結した形式でラベル値を表す。例えば地点Aに出現した
ラベル値pを「A:p」と表現する。また、図3と図4
に示すサンプリングのタイミングは同一であるものとす
る。例えば、第1番目の時点における媒体伝達速度の方
向および大きさはそれぞれ10度および毎秒3メートル
であり、また地点A,B,Cにおける所定の要素のラベ
ル値はそれぞれp,u,qである。
In FIG. 4, at three points A, B, and C,
A label value of a predetermined element measured at predetermined sampling intervals starting from a certain time point is shown. In this case,
The label values that this element can take are p, q, r, s, t, u
Is one of The label value series at the point A is p, q, r, p, u, r, t, q, s. In addition,
In the following, when it is necessary to distinguish the points, the label value is represented in a format in which the point names are linked. For example, the label value p that has appeared at the point A is expressed as “A: p”. 3 and 4
Are the same. For example, the direction and magnitude of the medium transmission speed at the first time point are 10 degrees and 3 meters per second, respectively, and the label values of predetermined elements at points A, B, and C are p, u, and q, respectively. .

【0037】そして対応関係保持手段2は、媒体が空間
内を移動する速度である媒体伝達速度の範囲とその各範
囲を代表する代表媒体伝達速度との対応関係を保持す
る。媒体伝達速度の各範囲と代表媒体伝達速度との対応
関係は、例えば図5(a),(b)に示すように、媒体
伝達速度の大きさの各範囲と代表媒体伝達速度の大きさ
との対応関係と、媒体伝達速度の向きの各範囲と代表媒
体伝達速度の向きとの対応関係とで構成される。
The correspondence holding means 2 holds the correspondence between the range of the medium transmission speed, which is the speed at which the medium moves in the space, and the representative medium transmission speed representing each of the ranges. The correspondence between each range of the medium transmission speed and the representative medium transmission speed is, for example, as shown in FIGS. It is composed of a correspondence relationship and a correspondence relationship between each range of the direction of the medium transmission speed and the direction of the representative medium transmission speed.

【0038】図5(a)では、連続値である媒体伝達速
度の大きさが5つの範囲に分類され、図5(b)では、
媒体伝達速度の向きが8つの範囲に分類されている。図
5(b)の分類は、図5(c)に示すように所定の境界
(図5(c)における破線)に基づいて、媒体伝達速度
の向きを東、北東、北、北西、西、南西、南および南東
の8つの範囲に分割するようにしたものである。したが
って、図5(a),(b)に示す対応関係により、媒体
伝達速度は、33種類の代表媒体伝達速度のいずれかに
対応付けられている。ただし、向きが異なる大きさ0の
代表媒体伝達速度は同一のものとする。
In FIG. 5A, the magnitude of the medium transmission speed, which is a continuous value, is classified into five ranges. In FIG. 5B,
The directions of the medium transmission speed are classified into eight ranges. The classification in FIG. 5B is based on a predetermined boundary (dashed line in FIG. 5C) as shown in FIG. 5C, and the direction of the medium transmission speed is east, northeast, north, northwest, west, It is divided into eight ranges: southwest, south, and southeast. Therefore, according to the correspondence relationships shown in FIGS. 5A and 5B, the medium transmission speed is associated with one of the 33 types of representative medium transmission speeds. However, the representative medium transmission speeds of size 0 having different directions are the same.

【0039】媒体速度分類手段6は、媒体伝達速度系列
保持手段5に保持された媒体伝達速度系列を読み出し、
対応関係保持手段2に保持された対応関係に基づいて媒
体伝達速度系列を構成する各媒体伝達速度を代表媒体伝
達速度に変換して、媒体伝達速度系列を代表媒体伝達速
度の系列である代表媒体伝達速度系列に変換する。図5
(a),(b)に示す対応関係に基づいて、例えば図3
に示す媒体伝達速度系列を変換した場合、図6に示す代
表媒体伝達速度系列が得られる。
The medium speed classifying means 6 reads out the medium transmission speed series held in the medium transmission speed series holding means 5,
Based on the correspondence held in the correspondence holding means 2, each medium transmission speed constituting the medium transmission speed sequence is converted into a representative medium transmission speed, and the medium transmission speed sequence is represented by a representative medium transmission speed sequence. Convert to transmission speed series. FIG.
Based on the correspondence shown in FIGS. 3A and 3B, for example, FIG.
When the medium transmission speed series shown in FIG. 6 is converted, a representative medium transmission speed series shown in FIG. 6 is obtained.

【0040】次に、計算手段3は、地図情報保持手段1
に保持された地点のうちの2つの地点を第1の地点およ
び第2の地点とし、第1および第2の地点の空間的情報
および代表媒体伝達速度に基づいて、対応関係保持手段
2に保持された対応関係に現れる各代表媒体伝達速度に
ついて、第1の地点から第2の地点への地点間媒体伝達
時間および第2の地点から第1の地点への地点間媒体伝
達時間を計算する。
Next, the calculation means 3 comprises the map information holding means 1
Of the points stored in the first and second points are stored in the correspondence storing unit 2 based on the spatial information of the first and second points and the representative medium transmission speed. For each representative medium transmission speed appearing in the obtained correspondence, the point-to-point medium transmission time from the first point to the second point and the point-to-point medium transmission time from the second point to the first point are calculated.

【0041】このとき、計算手段3の距離算出手段22
は、地図情報保持手段1に保持された各地点の空間的情
報(各地点の緯度、経度など)に基づいて地点間距離を
計算する。空間的情報が緯度と経度で構成されている場
合、距離算出手段22は、例えば地球を球で近似した場
合の各地点間の地表面に沿った距離を地点間距離として
計算する。また、空間的情報が緯度、経度および高度で
構成されている場合、距離算出手段22は、例えば各地
点間を結ぶ線分の距離を地点間距離として計算する。な
お、距離の算出の際には、高度方向と地表面方向とで重
み付けを変えるようにしてもよい。その場合、例えば実
際の高度の代わりに、実際の高度に所定の定数を乗じた
値を使用すればよい。
At this time, the distance calculating means 22 of the calculating means 3
Calculates the distance between points based on the spatial information (latitude, longitude, etc. of each point) of each point held in the map information holding means 1. When the spatial information is composed of latitudes and longitudes, the distance calculation unit 22 calculates a distance along the ground surface between each point when the earth is approximated by a sphere as a point-to-point distance. When the spatial information includes latitude, longitude, and altitude, the distance calculation unit 22 calculates, for example, the distance between line segments connecting the points as the point-to-point distance. When calculating the distance, the weighting may be changed between the altitude direction and the ground surface direction. In that case, for example, instead of the actual altitude, a value obtained by multiplying the actual altitude by a predetermined constant may be used.

【0042】また、角度差算出手段21は、地図情報保
持手段1に保持された各地点の空間的情報と代表媒体伝
達速度に基づいて、対応関係保持手段2に保持された対
応関係に現れる各代表媒体伝達速度について、2つの地
点を第1の地点および第2の地点として第1の地点を起
点として第2の地点を通る半直線と代表媒体伝達速度の
向きとのなす角度を角度差として計算する。なお、角度
差は代表媒体伝達速度の向きから半直線に向かって反時
計回りに計測し、0度以上360度未満の値を取るもの
とする。例えば図7(a),(b)では、点Pを第1の
地点とし、点Qを第2の地点とした場合の角度差θを示
している。
Further, the angle difference calculating means 21 determines each of the points appearing in the correspondence held in the correspondence holding means 2 based on the spatial information of each point held in the map information holding means 1 and the representative medium transmission speed. With respect to the representative medium transmission speed, an angle formed by an angle between a half-line passing through the second point starting from the first point and the direction of the representative medium transmission speed with the two points as a first point and a second point. calculate. Note that the angle difference is measured counterclockwise from the direction of the representative medium transmission speed toward the half-line, and takes a value of 0 degree or more and less than 360 degrees. For example, FIGS. 7A and 7B show the angle difference θ when the point P is the first point and the point Q is the second point.

【0043】そして媒体伝達時間算出手段23は、距離
算出手段22により計算された地点間の距離、代表媒体
伝達速度、および角度差算出手段21により計算された
角度差に基づいて各地点対についての地点間媒体伝達時
間を計算する。
The medium transmission time calculation means 23 calculates the distance between the points calculated by the distance calculation means 22, the representative medium transmission speed, and the angle difference calculated by the angle difference calculation means 21 for each point pair. Calculate the point-to-point medium transfer time.

【0044】このとき、媒体伝達時間算出手段23の角
度差判定手段24は、角度差算出手段21により計算さ
れた角度差が所定の範囲内に存在するか否かを判定し、
第1の地点から第2の地点へ媒体が移動するか否か、お
よび第2の地点から第1の地点へ媒体が移動するか否か
についての情報である地点間媒体移動情報を生成し、距
離対媒体速度比算出手段25に供給する。
At this time, the angle difference determination means 24 of the medium transmission time calculation means 23 determines whether the angle difference calculated by the angle difference calculation means 21 is within a predetermined range,
Generating point-to-point medium movement information that is information about whether the medium moves from the first point to the second point, and whether the medium moves from the second point to the first point; It is supplied to the distance-to-medium speed ratio calculating means 25.

【0045】なお、一方の地点Pから他方の地点Qを通
過する半直線と代表媒体伝達速度の向きとのなす角度が
所定の角度より小さい場合には、一方の地点Pから他方
の地点Qへ媒体が移動すると判定される。すなわち、所
定の角度(すなわち角度の閾値)をθth度とすると、
角度差が0度〜θth度の範囲または(360−θt
h)度〜360度の範囲にある場合には第1の地点から
第2の地点へ媒体が移動すると判定される。一方、角度
差が(180−θth)度〜(180+θth)度の範
囲にある場合には第2の地点から第1の地点へ媒体が移
動すると判定される。
If the angle between the half-line passing from one point P to the other point Q and the direction of the representative medium transmission speed is smaller than a predetermined angle, the point P moves from one point P to the other point Q. It is determined that the medium moves. That is, assuming that a predetermined angle (that is, a threshold value of the angle) is θth degree,
The angle difference is in the range of 0 degree to θth degree or (360−θt
h) If it is in the range of degrees to 360 degrees, it is determined that the medium moves from the first point to the second point. On the other hand, when the angle difference is in the range of (180−θth) degrees to (180 + θth) degrees, it is determined that the medium moves from the second point to the first point.

【0046】距離対媒体速度比算出手段25は、角度差
判定手段24からの地点間媒体移動情報を参照し、第1
の地点から第2の地点へ媒体が移動すると判定された場
合には、距離算出手段22により計算された地点間距離
を代表媒体伝達速度の大きさで除算して第1の地点から
第2の地点への地点間媒体伝達時間を算出する。一方、
第1の地点から第2の地点へ媒体が移動しないと判定さ
れた場合には、第1の地点から第2の地点への地点間媒
体伝達時間は所定の大きな値に設定される。また、距離
対媒体速度比算出手段25は、同様にして、第2の地点
から第1の地点へ媒体が移動すると判定された場合に
は、地点間距離を代表媒体伝達速度の大きさで除算して
第2の地点から第1の地点への地点間媒体伝達時間を算
出する。一方、第2の地点から第1の地点へ媒体が移動
しないと判定された場合には、第2の地点から第1の地
点への地点間媒体伝達時間は所定の大きな値に設定され
る。
The distance-to-medium speed ratio calculating means 25 refers to the point-to-point medium movement information from the angle difference judging means 24, and
When it is determined that the medium moves from the first point to the second point, the distance between the points calculated by the distance calculating means 22 is divided by the magnitude of the representative medium transmission speed, and the distance from the first point to the second point is calculated. Calculate the point-to-point medium transmission time to the point. on the other hand,
When it is determined that the medium does not move from the first point to the second point, the point-to-point medium transmission time from the first point to the second point is set to a predetermined large value. Similarly, when it is determined that the medium moves from the second point to the first point, the distance-to-medium speed ratio calculating means 25 divides the distance between the points by the magnitude of the representative medium transmission speed. Then, the point-to-point medium transmission time from the second point to the first point is calculated. On the other hand, if it is determined that the medium does not move from the second point to the first point, the point-to-point medium transmission time from the second point to the first point is set to a predetermined large value.

【0047】距離対媒体速度比算出手段25による地点
間媒体伝達時間は媒体伝達時間保持手段4に供給され、
保持される。
The point-to-point medium transmission time by the distance-to-medium speed ratio calculation means 25 is supplied to the medium transmission time holding means 4,
Will be retained.

【0048】ここで、例えば図2の地点A,B,Cにつ
いて、距離算出手段22によりAB間の距離、AC間の
距離およびBC間の距離がそれぞれ1073メートル、
2520メートルおよび2280メートルと算出され、
角度差判定手段24における角度の閾値θthが30度
である場合の計算手段3の各部の動作について具体的に
説明する。また、図6における第1番目の時点から第4
番目の時点までの期間のように、このときの代表媒体伝
達速度の向きは0度、すなわち真東の方向であり、その
大きさは毎秒4メートルであるとする。
Here, for example, for points A, B, and C in FIG. 2, the distance calculation means 22 calculates that the distance between AB, the distance between AC and the distance between BC are 1073 meters, respectively.
Calculated as 2520 meters and 2280 meters,
The operation of each section of the calculation means 3 when the angle threshold θth in the angle difference determination means 24 is 30 degrees will be specifically described. In addition, from the first time point in FIG.
As in the period up to the third time point, the direction of the representative medium transmission speed at this time is 0 degrees, that is, the direction of east, and its magnitude is 4 meters per second.

【0049】まず地点A,Bについての処理について説
明する。地点Aを第1の地点、地点Bを第2の地点とす
ると、角度差算出手段21は、代表媒体伝達速度の向き
と半直線ABとの角度を反時計回りに計測し、角度差と
して270度を出力する。次に角度差判定手段24は角
度差が所定の範囲内に存在するか否かを判定し、その判
定結果である地点間媒体移動情報を出力する。角度差が
270度の場合、0度〜30度の範囲にも330度〜3
60度の範囲にもないので地点Aから地点Bへの媒体の
移動はないと判定され、角度差が150度〜210度の
範囲にもないので地点Bから地点Aへの媒体の移動もな
いと判定される。そしてこの場合、地点A,B間では媒
体の移動はないので、距離対媒体速度比算出手段25に
より、地点Aから地点Bへの地点間媒体伝達時間および
地点Bから地点Aへの地点間媒体伝達時間は所定の大き
な値とされる。
First, the processing for points A and B will be described. Assuming that the point A is a first point and the point B is a second point, the angle difference calculation means 21 measures the angle between the direction of the representative medium transmission speed and the half-line AB in a counterclockwise direction, and calculates 270 as the angle difference. Output degrees. Next, the angle difference determination means 24 determines whether or not the angle difference is within a predetermined range, and outputs the point-to-point medium movement information as a result of the determination. If the angle difference is 270 degrees, 330 degrees to 3 also in the range of 0 degrees to 30 degrees
It is determined that there is no movement of the medium from point A to point B because it is not in the range of 60 degrees, and there is no movement of the medium from point B to point A because the angle difference is not in the range of 150 to 210 degrees. Is determined. In this case, since the medium does not move between the points A and B, the distance-to-medium velocity ratio calculating means 25 calculates the medium-to-point medium transmission time from the point A to the point B and the medium between the points B to the point A. The transmission time is set to a predetermined large value.

【0050】次に地点B,Cについての処理について説
明する。地点Bを第1の地点、地点Cを第2の地点とす
ると、角度差算出手段21により計算される角度差は0
度となる。角度差が0度である場合、0度〜30度の範
囲にあるので、角度差判定手段24により、地点Bから
地点Cへの媒体の移動があるものと判定され、角度差が
150度〜210度の範囲にはないので、地点Cから地
点Bへの媒体の移動はないと判定される。そして距離対
媒体速度比算出手段25により、地点BC間の距離(=
2280メートル)が代表媒体伝達速度(=毎秒4メー
トル)で除算され、地点Bから地点Cへの地点間媒体伝
達時間が570秒と算出される。また、地点Cから地点
Bへの地点間媒体伝達時間が所定の大きな値に設定され
る。
Next, the processing for the points B and C will be described. Assuming that point B is a first point and point C is a second point, the angle difference calculated by the angle difference calculating means 21 is 0.
Degree. When the angle difference is 0 degree, the angle difference is in the range of 0 degree to 30 degrees, so that the angle difference determination unit 24 determines that the medium has moved from the point B to the point C, and the angle difference is 150 degrees to Since it is not within the range of 210 degrees, it is determined that the medium has not moved from the point C to the point B. Then, the distance between the points BC (=
2280 meters) is divided by the representative medium transfer speed (= 4 meters per second), and the point-to-point medium transfer time from point B to point C is calculated to be 570 seconds. The point-to-point medium transmission time from point C to point B is set to a predetermined large value.

【0051】最後に、地点A,Cについての処理につい
て説明する。地点Aを第1の地点、地点Cを第2の地点
とすると、同様にして角度差算出手段21により計算さ
れる角度差は約334.7度となる。角度差が約33
4.7度である場合、330度〜360度の範囲にある
ので、角度差判定手段24により、地点Aから地点Cへ
の媒体の移動があるものと判定され、角度差が150度
〜210度の範囲にはないので地点Cから地点Aへの媒
体の移動はないと判定される。そして、距離対媒体速度
比算出手段25により、地点AC間の距離(=2520
メートル)が媒体伝達速度(=毎秒4メートル)で除算
され、地点Aから地点Cへの地点間媒体伝達時間が63
0秒と算出される。また、地点Cから地点Aへの地点間
媒体伝達時間が所定の大きな値に設定される。
Finally, the processing for points A and C will be described. Assuming that the point A is the first point and the point C is the second point, the angle difference calculated by the angle difference calculating means 21 in the same manner is about 334.7 degrees. Angle difference is about 33
In the case of 4.7 degrees, since the angle is in the range of 330 degrees to 360 degrees, the angle difference determination means 24 determines that the medium has moved from the point A to the point C, and the angle difference is 150 degrees to 210 degrees. It is determined that there is no movement of the medium from point C to point A because it is not within the range of degrees. Then, the distance-to-medium speed ratio calculating means 25 calculates the distance between the points AC (= 2520).
Meters) is divided by the medium transmission speed (= 4 meters per second), and the point-to-point medium transmission time from point A to point C is 63
It is calculated as 0 seconds. The point-to-point medium transmission time from point C to point A is set to a predetermined large value.

【0052】以上のように、代表媒体伝達速度の向きが
0度(真東の方向)であり、その大きさが毎秒4メート
ルである場合、地点Aから地点Bへ、地点Bから地点A
へ、地点Cから地点Bへ、および地点Cから地点Aへの
地点間媒体伝達時間はいずれも所定の大きな値となり、
地点Aから地点Cへの地点間媒体伝達時間、および地点
Bから地点Cへの地点間媒体伝達時間はそれぞれ630
秒および570秒となる。なお、同一地点間の地点間媒
体伝達時間は0秒とする。
As described above, when the direction of the representative medium transmission speed is 0 degrees (the direction of east) and the size is 4 meters per second, from the point A to the point B, from the point B to the point A
, The point-to-point medium transmission time from point C to point B, and from point C to point A are all predetermined large values,
The point-to-point medium transmission time from point A to point C and the point-to-point medium transmission time from point B to point C are each 630.
Seconds and 570 seconds. Note that the point-to-point medium transmission time between the same points is 0 second.

【0053】また、代表媒体伝達速度の向きが270度
(真南の方向)であり、その大きさが毎秒4メートルで
ある場合、地点Bから地点Aへ、地点Aから地点Cへ、
地点Cから地点Aへ、地点Bから地点Cへ、および地点
Cから地点Bへの地点間媒体伝達時間はいずれも所定の
大きな値となり、地点Aから地点Bへの地点間媒体伝達
時間は約268.3秒となる。他の代表媒体伝達速度に
対しても同様にして、地点間媒体伝達時間が計算され
る。
When the direction of the representative medium transmission speed is 270 degrees (in the direction of true south) and the size is 4 meters per second, from point B to point A, from point A to point C,
The point-to-point medium transmission time from point C to point A, point B to point C, and point C to point B are all predetermined large values, and the point-to-point medium transmission time from point A to point B is approximately 268.3 seconds. The point-to-point medium transmission time is similarly calculated for other representative medium transmission speeds.

【0054】次に、ラベル値間制約判定手段7、および
ラベル値対生成手段9〜ルール抽出手段15により、ラ
ベル値系列保持手段8に保持されたラベル値系列から地
点間媒体伝達時間を考慮して高頻度ラベル値組が抽出さ
れ、高頻度ラベル値組に基づいてif−then形式の
ルールが抽出される。
Next, the inter-point value transmission time is considered from the label value series held by the label value series holding means 8 by the label value constraint determining means 7 and the label value pair generating means 9 to the rule extracting means 15. Then, a high-frequency label value set is extracted, and a rule in the if-then format is extracted based on the high-frequency label value set.

【0055】なお、ラベル値組とは、ある時点を基準と
した時間差をそれぞれ付与された複数のラベル値から構
成されるパターンのことであり、高頻度ラベル値組と
は、ラベル値の時系列データに出現する頻度が所定の下
限値以上のラベル値組のことである。また、ラベル値の
時系列データに出現する頻度が所定の下限値以上のラベ
ル値を高頻度ラベル値という。なお、説明を簡単にする
ために、以下「ラベル値」を1個のラベル値で構成され
るラベル値組として取り扱うこともある。
Note that a label value set is a pattern composed of a plurality of label values each given a time difference with respect to a certain point in time, and a frequent label value set is a time series of label values. A label value set whose frequency of occurrence in data is equal to or higher than a predetermined lower limit value. A label value whose frequency of occurrence in the time-series data of the label value is equal to or higher than a predetermined lower limit value is referred to as a high-frequency label value. For the sake of simplicity, the “label value” may be treated as a label value set composed of one label value.

【0056】また、以下ではラベル値組を、地点、ラベ
ル値および基準時からの経過時間で表現する。例えば
「A:p(0),B:x(+2)」のような形式でラベ
ル値を表現する。これは「地点Aでラベル値pが出現し
て2単位時間後に地点Bでラベル値xが出現するパター
ン」を表す。ここで、基準とする時点だけが違うような
ラベル値組は同一であるものとする。例えばラベル値組
「A:p(0),B:x(+2)」と、ラベル値組
「A:p(−2),B:x(0)」は同じものとして考
える。
In the following, a label value set is represented by a point, a label value, and an elapsed time from the reference time. For example, the label value is expressed in a format such as “A: p (0), B: x (+2)”. This represents a "pattern in which the label value x appears at the point B two units after the appearance of the label value p at the point A". Here, it is assumed that label value sets that differ only in reference time are the same. For example, the label value set “A: p (0), B: x (+2)” and the label value set “A: p (−2), B: x (0)” are considered to be the same.

【0057】さらに、ラベル値組を構成するラベル値の
個数のことを、そのラベル値組の長さと呼び、長さkの
高頻度ラベル値組を要素とする集合をL(k)で表す。
さらに、高頻度ラベル値組の候補となるラベル値組のこ
とを高頻度ラベル値組候補と呼び、長さkの高頻度ラベ
ル値組候補を要素とする集合をC(k)で表す。
Further, the number of label values forming a label value set is called the length of the label value set, and a set having a high-frequency label value set of length k as an element is represented by L (k).
Further, a label value set that is a candidate for a high-frequency label value set is referred to as a high-frequency label value set candidate, and a set including a high-frequency label value set candidate having a length k as an element is represented by C (k).

【0058】まず、ラベル値系列保持手段8に保持され
たラベル値系列に含まれる全てのラベル値が高頻度ラベ
ル値候補の集合C(1)の要素として高頻度ラベル値組
候補管理手段11により保持され、ラベル値組検証手段
10により各高頻度ラベル値候補がラベル値系列で検索
され、その出現頻度がカウントされ、高頻度ラベル値組
抽出手段12により出現頻度に基づいてC(1)から高
頻度ラベル値の集合L(1)が抽出され、高頻度ラベル
値組管理手段13により保持される。そしてラベル値対
生成手段9により各地点間媒体伝達時間を考慮してL
(1)から高頻度ラベル値組候補の集合C(2)が生成
され、高頻度ラベル値組候補管理手段11により保持さ
れる。そして高頻度ラベル値組抽出手段12により出現
頻度に基づいてC(2)からL(2)が抽出され、高頻
度ラベル値組管理手段13により保持される。以下、L
(k)が空になるまで、ラベル値組生成手段14により
L(k)からC(k+1)が生成され、高頻度ラベル値
組抽出手段12によりC(k+1)からL(k+1)が
抽出される。そして、ルール抽出手段15により高頻度
ラベル値組からif−then形式のルールが抽出され
る。
First, all the label values included in the label value series held in the label value series holding means 8 are used by the high frequency label value set candidate management means 11 as elements of the set C (1) of the high frequency label value candidates. The label value set verification means 10 searches for each high-frequency label value candidate in the label value series, counts the frequency of occurrence, and the high-frequency label value set extraction means 12 calculates the high-frequency label value candidates from C (1) based on the frequency of occurrence. A set L (1) of frequent label values is extracted and held by the frequent label value set management unit 13. Then, the label value pair generation means 9 takes into account the medium transmission time between each point, and
A set C (2) of frequent label value set candidates is generated from (1), and held by the frequent label value set candidate management unit 11. Then, L (2) is extracted from C (2) based on the appearance frequency by the frequent label value set extracting means 12 and held by the frequent label value set managing means 13. Hereinafter, L
Until (k) becomes empty, label value set generation means 14 generates C (k + 1) from L (k), and high frequency label value set extraction means 12 extracts L (k + 1) from C (k + 1). You. Then, a rule in the if-then format is extracted from the high-frequency label value set by the rule extracting unit 15.

【0059】以下、各部の処理について詳細に説明す
る。まず、高頻度ラベル値組候補管理手段11が、ラベ
ル値系列保持手段8に保持されたラベル値系列に含まれ
る全てのラベル値を高頻度ラベル値候補の集合C(1)
の要素として保持する。ラベル値組検証手段10は、高
頻度ラベル値組候補管理手段11に保持された各高頻度
ラベル値候補をラベル値系列で検索し、その高頻度ラベ
ル値候補をラベル値系列で検出する毎に、その回数をカ
ウントする。そして高頻度ラベル値組候補管理手段11
はそれに応じてその高頻度ラベル値候補の出現頻度を更
新していく。
Hereinafter, the processing of each section will be described in detail. First, the frequent label value set candidate management unit 11 converts all the label values included in the label value series held in the label value series holding unit 8 into a set C (1) of frequent label value candidates.
As an element. The label value set verifying means 10 searches each high frequency label value candidate held in the high frequency label value set candidate management means 11 by a label value series, and every time the high frequency label value candidate is detected by the label value series. , Count the number of times. And high frequency label value set candidate management means 11
Updates the appearance frequency of the high-frequency label value candidate accordingly.

【0060】次に、高頻度ラベル値組抽出手段12は、
高頻度ラベル値組候補管理手段11に保持された高頻度
ラベル値候補およびその出現頻度に基づいて、出現頻度
が所定の下限値以上である高頻度ラベル値候補を高頻度
ラベル値として抽出し、その出現頻度とともに高頻度ラ
ベル値組管理手段13に供給する。高頻度ラベル値組管
理手段13は、その高頻度ラベル値およびその出現頻度
を保持する。
Next, the frequent label value set extracting means 12
Based on the high-frequency label value candidates held by the high-frequency label value set candidate management unit 11 and the frequency of appearance, high frequency label value candidates whose appearance frequency is equal to or higher than a predetermined lower limit are extracted as high frequency label values, It is supplied to the high-frequency label value set management means 13 together with the appearance frequency. The frequent label value set management unit 13 holds the frequent label value and its appearance frequency.

【0061】そして、ラベル値対生成手段9は、代表媒
体伝達速度および地点間媒体伝達時間を考慮して、2つ
の高頻度ラベル値を組み合わせてC(2)の要素である
高頻度ラベル値組候補を生成し、ラベル値系列保持手段
8に保持されたラベル値系列での各高頻度ラベル値組候
補の出現頻度をカウントする。そして高頻度ラベル値組
候補およびその出現頻度が高頻度ラベル値組候補管理手
段11により保持される。
Then, the label value pair generating means 9 combines the two high frequency label values in consideration of the representative medium transmission speed and the point-to-point medium transmission time, and sets the high frequency label value group which is an element of C (2). A candidate is generated, and the appearance frequency of each high-frequency label value set candidate in the label value series held in the label value series holding means 8 is counted. Then, the frequent label value set candidate and its appearance frequency are held by the frequent label value set candidate management unit 11.

【0062】ここでラベル値対生成手段9の各部の動作
について説明する。まずラベル値部分系列抽出手段31
は、ラベル値系列保持手段8に保持されたラベル値系列
のうち所定の時間幅に含まれる部分を、ラベル値部分系
列として抽出する。この所定の時間幅は最大伝達時間と
同一とする。
The operation of each part of the label value pair generation means 9 will now be described. First, the label value subsequence extracting means 31
Extracts a part included in a predetermined time width from the label value series held in the label value series holding means 8 as a label value partial series. This predetermined time width is the same as the maximum transmission time.

【0063】次に高頻度ラベル値検出手段32は、ラベ
ル値部分系列抽出手段31により抽出されたラベル値部
分系列、および高頻度ラベル値組管理手段13に保持さ
れた高頻度ラベル値の集合L(1)に基づいて、ラベル
値部分系列の最初の時点におけるラベル値のうちL
(1)の要素と一致するものを第1の高頻度ラベル値と
して検出する。
Next, the high-frequency label value detecting means 32 outputs the label value subsequence extracted by the label value subsequence extracting means 31 and the set L of the high frequency label values held in the high frequency label value Based on (1), L among the label values at the beginning of the label value
An element that matches the element of (1) is detected as a first high-frequency label value.

【0064】そして地点抽出手段33は、高頻度ラベル
値検出手段32により検出された第1の高頻度ラベル
値、および媒体伝達時間保持手段4により保持された地
点間媒体伝達時間に基づいて、第1の高頻度ラベル値の
出現時点での、第1の高頻度ラベル値の出現地点を起点
とした場合の地点間媒体伝達時間が所定の最大伝達時間
以下である地点を伝達時間制約満足地点として抽出し、
その地点間媒体伝達時間とともにラベル値対抽出手段3
4に供給する。
The point extracting means 33 determines the first high-frequency label value detected by the high-frequency label value detecting means 32 and the point-to-point medium transmission time held by the medium transmission time holding means 4. The point at which the point-to-point medium transmission time is less than or equal to a predetermined maximum transmission time when the appearance point of the first high-frequency label value is the starting point at the time when the first high-frequency label value is output is defined as the transmission time constraint satisfaction point. Extract,
Label value pair extracting means 3 together with the medium transmission time between points
4

【0065】ラベル値対抽出手段34は、ラベル値部分
系列抽出手段31により抽出されたラベル値部分系列、
高頻度ラベル値検出手段32により検出された第1の高
頻度ラベル値、地点抽出手段33からの伝達時間制約満
足地点およびその地点間媒体伝達時間、並びに高頻度ラ
ベル値組管理手段13に保持された高頻度ラベル値の集
合L(1)に基づいて、ラベル値部分系列における伝達
時間制約満足地点に関するラベル値のうち、ラベル値部
分系列の最初の時点を基準として、その地点に対応する
地点間媒体伝達時間以降のラベル値であり、かつL
(1)の要素であるラベル値を第2の高頻度ラベル値と
して検出し、第1の高頻度ラベル値および第2の高頻度
ラベル値、並びに両者の地点および両者間の時間差より
長さ2の高頻度ラベル値組候補を生成し、その出現頻度
をカウントする。
The label value pair extraction means 34 outputs the label value subsequence extracted by the label value subsequence extraction means 31,
The first high-frequency label value detected by the high-frequency label value detection means 32, the transmission time constraint satisfaction point from the point extraction means 33 and the medium transmission time between the points, and the high-frequency label value set management means 13 are retained. Based on the set L (1) of the frequent label values, among the label values relating to the transmission time constraint satisfaction points in the label value subsequence, the distance between the points corresponding to the point is determined based on the first time point of the label value subsequence. The label value after the medium transmission time, and L
The label value, which is an element of (1), is detected as a second high-frequency label value, and the length is calculated based on the first high-frequency label value, the second high-frequency label value, and both points and the time difference between the two. Is generated, and the appearance frequency is counted.

【0066】このようにして生成された長さ2の高頻度
ラベル値組候補の集合C(2)と各高頻度ラベル値候補
の出現頻度が高頻度ラベル値組候補管理手段11により
保持される。
The set C (2) of the frequent label value set candidates of length 2 generated in this way and the appearance frequency of each frequent label value candidate are held by the frequent label value set candidate management means 11. .

【0067】そして高頻度ラベル値組抽出手段12は、
高頻度ラベル値組候補管理手段11に保持された高頻度
ラベル値組候補およびその出現頻度に基づいて、出現頻
度が所定の下限値以上である高頻度ラベル値組候補を高
頻度ラベル値組として抽出し、その出現頻度とともに高
頻度ラベル値組管理手段13に供給する。
Then, the frequent label value set extracting means 12
Based on the frequent label value set candidates held in the frequent label value set candidate management means 11 and their appearance frequencies, the frequent label value set candidates whose appearance frequency is equal to or higher than a predetermined lower limit are defined as the frequent label value sets. It is extracted and supplied to the high-frequency label value set management means 13 together with its appearance frequency.

【0068】次に、ラベル値組生成手段14は、高頻度
ラベル値組管理手段13に保持された高頻度ラベル値組
の集合L(k)(k>1)からC(k+1)を生成し
て、高頻度ラベル値組候補管理手段11に供給する。
Next, the label value set generating means 14 generates C (k + 1) from the set L (k) (k> 1) of the frequent label value sets held in the frequent label value set managing means 13. Then, it is supplied to the high-frequency label value set candidate management unit 11.

【0069】このときラベル値組生成手段14は、高頻
度ラベル値組管理手段13に保持された長さkの高頻度
ラベル値組の集合L(k)(k>1)のうちの次の2つ
の条件を満たす2つの高頻度ラベル値組を抽出し、その
2つの高頻度ラベル値組を組み合わせて長さ(k+1)
の高頻度ラベル値組候補を生成する。第1の条件:ラベ
ル値組における時間的に最後のラベル値が同一である。
ただし、ここでラベル値が同一というのは地点も含めて
同一であるものとする。第2の条件:ラベル値組におけ
る時間的に最後のラベル値およびその他の1個のラベル
値を除いた長さ(k−2)のラベル値組が同一である。
At this time, the label value set generating means 14 selects the next one of the set L (k) (k> 1) of the frequent label value sets of length k held in the frequent label value set managing means 13. Two high-frequency label value sets satisfying the two conditions are extracted, and the two high-frequency label value sets are combined to obtain a length (k + 1).
Is generated. First condition: The temporally last label values in the label value set are the same.
However, the label values being the same here are the same including the point. Second condition: the label value sets of length (k-2) excluding the temporally last label value and one other label value in the label value set are the same.

【0070】時間的に最後のラベル値の出現時点を基準
点として上記条件を満たす2つの高頻度ラベル値組が以
下のように表せたとする。 「a(ta),b(tb),...,c(tc),p
(tp),x(0)」 「a(ta),b(tb),...,c(tc),q
(tq),x(0)」 ただし、ta,tb,...,tc,tp,tqは全て
0以下の数値である。
It is assumed that two sets of high-frequency label values satisfying the above conditions can be expressed as follows, using the present time of the last label value in time as a reference point. "A (ta), b (tb), ..., c (tc), p
(Tp), x (0) "" a (ta), b (tb), ..., c (tc), q
(Tq), x (0) "where ta, tb,. . . , Tc, tp, and tq are all numerical values of 0 or less.

【0071】するとこれらの高頻度ラベル値組から長さ
(k+1)の高頻度ラベル値組候補が次のように生成さ
れる。 「a(ta),b(tb),...,c(tc),p
(tp),q(tq),x(0)」
Then, a high-frequency label value set candidate of length (k + 1) is generated from these high-frequency label value sets as follows. "A (ta), b (tb), ..., c (tc), p
(Tp), q (tq), x (0) "

【0072】このようにして高頻度ラベル値組の集合L
(k)(k>1)から高頻度ラベル値組候補の集合C
(k+1)が生成され、高頻度ラベル値組候補管理手段
11に供給され、保持される。
In this way, the set L of the frequent label value sets
From (k) (k> 1), a set C of frequent label value set candidates
(K + 1) is generated, supplied to the frequent label value set candidate management unit 11, and held.

【0073】そしてこの高頻度ラベル値組候補の集合C
(k+1)における各高頻度ラベル値組候補がラベル値
系列で検索され、高頻度ラベル値組候補が検出される
と、ラベル値間制約判定手段7により上述の制約条件の
判定が実行され、その制約条件を満たす場合のみ、その
出現頻度がカウントされる。それに応じて高頻度ラベル
値組候補管理手段11は、保持している出現頻度を更新
する。
Then, the set C of the frequent label value set candidates
Each high-frequency label value set candidate in (k + 1) is searched in the label value series, and when a high-frequency label value set candidate is detected, the above-described constraint condition determination is executed by the label value constraint determination unit 7. Only when the constraint condition is satisfied, the appearance frequency is counted. In response, the frequent label value set candidate management unit 11 updates the held appearance frequency.

【0074】このときラベル値間制約判定手段7は、そ
の高頻度ラベル値組候補を構成するラベル値のうちの時
間的に最後のラベル値と残りのラベル値のうちの1つと
で構成される2ラベル値組(長さ2のラベル値組)の時
間的に前側のラベル値を前側ラベル値とし時間的に後側
のラベル値を後側ラベル値として、すべての前側ラベル
値に関して、前側ラベル値の出現時点と後側ラベル値の
出現時点との時間差が前側ラベル値の出現時点での、前
側ラベル値の出現地点から後側ラベル値の出現地点への
地点間媒体伝達時間以上であるという制約条件を満たす
か否かを判定し、その判定結果をラベル値組検証手段1
0に供給する。
At this time, the label value constraint determining means 7 is composed of the temporally last label value of the label values constituting the frequent label value set candidate and one of the remaining label values. For all front label values, the label value on the temporally front side of the two label value pairs (label value pair of length 2) is defined as the front label value, and the label value on the temporal rear side is defined as the rear label value. It is said that the time difference between the present time of the value output and the present time of the rear label value is equal to or longer than the point-to-point medium transmission time from the appearance point of the front label value to the appearance point of the rear label value at the present time of the preceding label value. It is determined whether or not the constraint condition is satisfied, and the determination result is used as a label value set verification unit 1
Supply 0.

【0075】ここで、時間的に最後のラベル値の出現時
点を0として高頻度ラベル値組が次のように示される場
合のラベル値間制約判定手段7の動作について説明す
る。 「a(ta),b(tb),...,c(tc),x
(0)」 ただし、ta,tb,...,tcは全て0以下の数値
である。
Here, the operation of the inter-label-value constraint determining means 7 in the case where the time point at which the last label value appears in time is set to 0 and the high-frequency label value set is indicated as follows will be described. "A (ta), b (tb), ..., c (tc), x
(0) "where ta, tb,. . . , Tc are all numerical values of 0 or less.

【0076】まず、2ラベル値組「a(ta),x
(0)」については、これらのラベル値間の時間差(=
|ta|)が、ラベル値a(ta)の出現時点での代表
媒体伝達速度に基づいて計算される、ラベル値a(t
a)の出現地点からラベル値x(0)の出現地点への地
点間媒体伝達時間以上であるか否かが判定され、同様
に、他の2ラベル値組「b(tb),x(0)」,・・
・,「c(tc),x(0)」についても判定され、す
べての2ラベル値組についての判定結果が真である場合
に、ラベル値間制約判定手段7は制約条件を満足すると
いう内容の判定結果がラベル値組検証手段10に供給さ
れる。
First, the two-label value set “a (ta), x
(0) ”, the time difference between these label values (=
| Ta |) is calculated based on the representative medium transmission speed at the time when the label value a (ta) is output.
It is determined whether it is longer than the point-to-point medium transmission time from the appearance point of a) to the appearance point of the label value x (0), and similarly, the other two label value sets “b (tb), x (0) ) ", ...
, "C (tc), x (0)", and if the determination results for all two label value pairs are true, the label value constraint determination means 7 satisfies the constraint condition. Is supplied to the label value set verification means 10.

【0077】以下、L(k)が空になるまで、ラベル値
間制約判定手段7、およびラベル値組検証手段10〜ラ
ベル値組生成手段14が同様に動作し、より長い高頻度
ラベル値組が順次抽出され、高頻度ラベル値組管理手段
13に順次蓄積保持される。
Until L (k) becomes empty, the inter-label-value constraint determining means 7 and the label-value-set verifying means 10 to the label-value-set generating means 14 operate in the same manner, and the longer high-frequency label-value Are sequentially extracted and accumulated and held in the high-frequency label value set management unit 13 in order.

【0078】このようにして高頻度ラベル値組の抽出処
理が終了した後、各長さの高頻度ラベル値組からルール
抽出手段15によりif−then形式のルールが生成
される。このときルール抽出手段15は、高頻度ラベル
値組管理手段13に保持された高頻度ラベル値組および
その出現頻度、並びにラベル値系列保持手段8に保持さ
れたラベル値系列に基づいて、高頻度ラベル値組におけ
る時間的に最後のラベル値を結論部とし、残りのラベル
値を条件部として、条件部が出現する割合とその高頻度
ラベル値全体が出現する割合との比が所定の下限値以上
である条件部および結論部の対をif−then形式の
ルールとして抽出する。
After the process of extracting the high-frequency label value sets has been completed in this way, a rule in the if-then format is generated by the rule extracting means 15 from the high-frequency label value sets of each length. At this time, the rule extracting unit 15 determines the high-frequency label value set held by the high-frequency label value set managing unit 13 and the appearance frequency thereof, and the high-frequency label value series With the temporally last label value in the label value set as the conclusion part and the remaining label values as the condition part, the ratio of the ratio of the occurrence of the condition part to the ratio of the appearance of the entire high-frequency label value is a predetermined lower limit. The pair of the condition part and the conclusion part described above is extracted as a rule in the if-then format.

【0079】例えば、高頻度ラベル値組「a(ta),
b(tb),...,c(tc),x(tx)」からル
ール候補「a(ta),b(tb),...,c(t
c)→x(tx)」が生成される。ただし、ta,t
b,...,tcは全てtx以下の数値であり、「a
(ta),b(tb),...,c(tc)」が条件部
であり、「x(tx)」が結論部である。
For example, the frequent label value set “a (ta),
b (tb),. . . , C (tc), x (tx) ”and rule candidates“ a (ta), b (tb),.
c) → x (tx) ”is generated. Where ta, t
b,. . . , Tc are numerical values equal to or less than tx, and “a
(Ta), b (tb),. . . , C (tc) ”is the condition part, and“ x (tx) ”is the conclusion part.

【0080】そしてルール抽出手段15は、条件部に対
応するラベル値組のラベル値系列での出現頻度を算出
し、それに基づいて、条件部に対応するラベル値組が発
生した場合に結論部に対応するラベル値が出現する割合
を算出し、条件部に対応するラベル値組が出現する割合
と高頻度ラベル値組が出現する割合との比が所定の下限
値以上であるルール候補をルールとする。このときラベ
ル値系列の最後の「条件部および結論部に対応する高頻
度ラベル値組によって張られる時間幅を単位時間で除算
した数」の個数分の時点のいずれかを開始点とする条件
部に対応するラベル値組の出現は無視し、出現頻度には
含まれないようにする。これは、ルール候補について、
条件部に対応するラベル値組が発生した場合に結論部に
対応するラベル値が出現する割合を正確に求めるため
に、結論部に対応するラベル値の出現が不明である条件
部に対応するラベル値組を除外する必要があるからであ
る。
Then, the rule extracting means 15 calculates the frequency of occurrence of the label value set corresponding to the condition part in the label value series, and, based on the calculated frequency, generates a label value set corresponding to the condition part to the conclusion part. The rate at which the corresponding label value appears is calculated, and a rule candidate whose ratio between the rate at which the label value set corresponding to the condition part appears and the rate at which the high-frequency label value set appears is equal to or greater than a predetermined lower limit is defined as a rule. I do. At this time, the condition part whose start point is any one of the number of times equal to the number of times obtained by dividing the time width spanned by the high-frequency label value set corresponding to the condition part and the conclusion part by the unit time, of the last of the label value series Are ignored, and are not included in the appearance frequency. This is for rule candidates,
In order to accurately determine the rate at which the label value corresponding to the conclusion part appears when the label value pair corresponding to the condition part occurs, the label corresponding to the condition part where the appearance of the label value corresponding to the conclusion part is unknown This is because it is necessary to exclude the value set.

【0081】なお、条件部に対応するラベル値組の出現
頻度を計算する場合、そのラベル値組が高頻度ラベル値
組であるときには、その出現頻度が既に計算され高頻度
ラベル値組管理手段13に保持されているので、それを
利用することができる。ただし、ラベル値系列の最後の
「条件部および結論部に対応する高頻度ラベル値組によ
って張られる時間幅を単位時間で除算した数」の個数分
の時点のいずれかを開始点とする条件部に対応するラベ
ル値組の出現は出現頻度には含まれないようにする。
When calculating the appearance frequency of the label value set corresponding to the condition part, if the label value set is a high-frequency label value set, the appearance frequency has already been calculated and the high-frequency label value , So you can use it. However, the condition part whose start point is any one of the number of times equal to the number of times obtained by dividing the time width set by the high-frequency label value pair corresponding to the condition part and the conclusion part by the unit time at the end of the label value series Is not included in the appearance frequency.

【0082】このようにして、高頻度ラベル値組からル
ールが抽出される。
In this way, rules are extracted from the frequent label value set.

【0083】以下、具体的に図4に示すラベル値系列か
ら図6に示す代表媒体速度系列に基づいて高頻度ラベル
値組およびルールを抽出する処理について説明する。
Hereinafter, a process for extracting a high-frequency label value set and a rule from the label value sequence shown in FIG. 4 based on the representative medium speed sequence shown in FIG. 6 will be described.

【0084】まず、L(1)の生成について説明する。
高頻度ラベル値組候補管理手段11は、図4に示すラベ
ル値系列のうちの各ラベル値を高頻度ラベル値候補の集
合C(1)の要素として保持する。なお、各高頻度ラベ
ル値候補の出現頻度は0に初期化されている。ラベル値
組検証手段10は、高頻度ラベル値候補をラベル値系列
で検索し、高頻度ラベル値候補が検出される毎にその回
数をカウントし、それに応じて高頻度ラベル値組候補管
理手段11は保持している出現頻度を更新する。したが
って図4のラベル値系列の地点Aに関するC(1)の場
合、「A:p」、「A:q」、「A:r」、「A:
s」、「A:t」および「A:u」の出現頻度はそれぞ
れ2、2、2,1、1および1になる。
First, generation of L (1) will be described.
The frequent label value set candidate management unit 11 holds each label value in the label value series shown in FIG. 4 as an element of a set C (1) of frequent label value candidates. Note that the appearance frequency of each high-frequency label value candidate is initialized to zero. The label value set verification means 10 searches the label value series for the frequent label value candidates, counts the number of times each of the frequent label value candidates is detected, and accordingly, the frequent label value set candidate management means 11 Updates the appearance frequency that is held. Therefore, in the case of C (1) relating to the point A in the label value series in FIG. 4, “A: p”, “A: q”, “A: r”, “A:
The appearance frequencies of "s", "A: t" and "A: u" are 2, 2, 2, 1, 1 and 1, respectively.

【0085】高頻度ラベル値組抽出手段12は、出現頻
度が所定の下限値以上である高頻度ラベル値候補を高頻
度ラベル値L(1)の要素として抽出する。所定の下限
値が2である場合、地点Aに関するC(1)の要素のう
ちの、出現頻度が2である「A:p」、「A:q」およ
び「A:r」がL(1)の要素として抽出され、その出
現頻度とともに高頻度ラベル値組管理手段13に保持さ
れる。同様にして、「B:q」、「B:t」、「C:
p」および「C:r」がL(1)の要素として保持され
る。
The high-frequency label value set extracting means 12 extracts high-frequency label value candidates whose appearance frequency is equal to or higher than a predetermined lower limit as elements of the high-frequency label value L (1). When the predetermined lower limit is 2, “A: p”, “A: q”, and “A: r” whose appearance frequency is 2 among the elements of C (1) relating to point A are L (1 ), And are stored in the high-frequency label value set management unit 13 together with the appearance frequency. Similarly, “B: q”, “B: t”, “C:
“p” and “C: r” are held as elements of L (1).

【0086】次にL(2)の生成について説明する。図
8はラベル値部分系列抽出手段31により抽出されたラ
ベル値部分系列の一例を示す図である。ラベル値対生成
手段9のラベル値部分系列抽出手段31はラベル値系列
保持手段8に保持されたラベル値系列のうち所定の時間
幅に含まれる部分をラベル値部分系列として抽出する。
例えば所定の時間幅が2単位時間(今の場合、1200
秒)である場合、図4のラベル値系列に対する第1番目
のラベル値部分系列は図8に示すようになる。ただし、
所定の時間幅である2単位時間の開始時点と終了時点の
ラベル値を両方とも同一のラベル値部分系列に含めるも
のとする。
Next, generation of L (2) will be described. FIG. 8 is a diagram showing an example of the label value subsequence extracted by the label value subsequence extracting means 31. The label value subsequence extracting means 31 of the label value pair generating means 9 extracts a part included in a predetermined time width from the label value series held in the label value series holding means 8 as a label value subsequence.
For example, the predetermined time width is 2 unit times (in this case, 1200
Second), the first label value subsequence for the label value sequence of FIG. 4 is as shown in FIG. However,
It is assumed that both the label values at the start time and the end time of two unit times having a predetermined time width are included in the same label value partial sequence.

【0087】そしてラベル値部分系列抽出手段31は、
開始時点を1単位時間ずつ移動させながら、順次、対応
するラベル値部分系列を抽出していき、開始時点がラベ
ル値系列の最後の時点であるラベル値部分系列を抽出し
た後、動作を終了する。
Then, the label value subsequence extracting means 31
While moving the start time point by one unit time, the corresponding label value subsequences are sequentially extracted, and after extracting the label value subsequence whose start time point is the last time point of the label value series, the operation ends. .

【0088】高頻度ラベル値検出手段32は、ラベル値
部分系列および高頻度ラベル値の集合L(1)に基づい
て、ラベル値部分系列の最初の時点におけるラベル値の
うちL(1)の要素と一致するものを第1の高頻度ラベ
ル値として検出する。図8に示すラベル値部分系列の場
合、「A:p」および「C:q」が第1の高頻度ラベル
値として抽出される。
Based on the label value subsequence and the set L (1) of frequent label values, the frequent label value detecting means 32 calculates the element of L (1) among the label values at the first time point of the label value subsequence. Is detected as the first high-frequency label value. In the case of the label value subsequence shown in FIG. 8, "A: p" and "C: q" are extracted as the first high-frequency label values.

【0089】そして地点抽出手段33は、第1の高頻度
ラベル値の出現時点における代表媒体伝達速度に関する
地点間媒体伝達時間のうちの第1の高頻度ラベル値の出
現地点を起点とした場合のものが最大伝達時間以下であ
る地点を伝達時間制約満足地点として抽出し、その地点
間媒体伝達時間とともにラベル値対抽出手段34に供給
する。なお今の場合、最大伝達時間は1200秒であ
る。
Then, the point extracting means 33 uses the point of appearance of the first high-frequency label value in the point-to-point medium transmission time relating to the representative medium transmission speed at the time when the first high-frequency label value is output as the starting point. A point whose value is shorter than the maximum transmission time is extracted as a transmission time constraint satisfaction point, and is supplied to the label value pair extraction means 34 together with the medium transmission time between the points. In this case, the maximum transmission time is 1200 seconds.

【0090】上述の第1の高頻度ラベル値A:pの場
合、その出現時点は第1番目の時点であり、図6に示す
ように、そのときの代表媒体伝達速度の向きは0度であ
り、その大きさは毎秒4メートルであり、ラベル値がサ
ンプリングされた地点はAである。また、上述のように
今の場合、地点Aから地点Bへの地点間媒体伝達時間お
よび地点Aから地点Cへの地点間媒体伝達時間は、上述
のようにそれぞれ所定の大きな値および630秒であ
る。したがって、地点B,Cのうち、地点Aを起点とし
た場合の地点間媒体時間が最大伝達時間1200秒以下
となるのは地点Cのみであり、地点Cが伝達時間制約満
足地点として抽出される。また、地点A自体も地点間媒
体伝達時間が0であるので伝達時間制約満足地点である
とすると、第1の高頻度ラベル値A:pに対する伝達時
間制約満足地点として地点Aと地点Cが抽出される。
In the case of the above-mentioned first high-frequency label value A: p, the present time is the first time point, and as shown in FIG. 6, the direction of the representative medium transmission speed at that time is 0 degree. Yes, its magnitude is 4 meters per second, and the point where the label value was sampled is A. Also, as described above, in this case, the point-to-point medium transmission time from point A to point B and the point-to-point medium transmission time from point A to point C are each a predetermined large value and 630 seconds, as described above. is there. Therefore, of the points B and C, only the point C has the maximum transmission time of 1200 seconds or less when the point A is the starting point, and the point C is extracted as the transmission time constraint satisfaction point. . In addition, since the point A itself is also a transmission time constraint satisfaction point because the inter-point medium transmission time is 0, points A and C are extracted as transmission time constraint satisfaction points for the first high-frequency label value A: p. Is done.

【0091】そしてラベル値対抽出手段34は、ラベル
値部分系列、第1の高頻度ラベル値、第1の高頻度ラベ
ル値に関する伝達時間制約満足地点およびその地点間媒
体伝達時間、並びに高頻度ラベル値の集合L(1)に基
づいて、長さ2の高頻度ラベル値組候補を生成する。こ
のとき、ラベル値部分系列における伝達時間制約満足地
点に関するラベル値のうち、ラベル値部分系列の最初の
時点を基準として、その地点に対応する地点間媒体伝達
時間以降のラベル値であり、かつL(1)の要素である
ラベル値を第2の高頻度ラベル値とし、第1の高頻度ラ
ベル値と第2の高頻度ラベル値、並びに両者の地点およ
び両者間の時間差で長さ2の高頻度ラベル値組候補を生
成し、その高頻度ラベル値組候補の出現頻度をカウント
する。
Then, the label value pair extracting means 34 generates the label value subsequence, the first high frequency label value, the transmission time constraint satisfaction point regarding the first high frequency label value and the medium transmission time between the points, and the high frequency label. Based on the value set L (1), a high-frequency label value set candidate having a length of 2 is generated. At this time, among the label values related to the transmission time constraint satisfaction point in the label value subsequence, the label value is the label value after the inter-point medium transmission time corresponding to the point with respect to the first time point of the label value subsequence, and L The label value, which is an element of (1), is defined as a second high-frequency label value, and the first high-frequency label value and the second high-frequency label value, and both points and the time difference between the two, the length of which is 2 A frequency label value set candidate is generated, and the appearance frequency of the high frequency label value set candidate is counted.

【0092】例えば第1の高頻度ラベル値A:pに関す
る伝達時間制約満足地点C(地点間媒体伝達時間=63
0秒)の場合、ラベル値部分系列のうち最初の時点から
630秒以降のラベル値は「C:r」のみである。ラベ
ル値「C:r」はL(1)の要素であるので、第1の高
頻度ラベル値A:pと組み合わせて「A:p(0),
C:r(+2)」なる高頻度ラベル値組候補が生成さ
れ、この高頻度ラベル値組候補の出現頻度がカウントさ
れ、高頻度ラベル値組候補管理手段11に保持されてい
るこの高頻度ラベル値組候補の出現頻度が更新される。
同様にして、例えば第1の高頻度ラベル値A:pに関す
る伝達時間制約満足地点A(地点間媒体伝達時間=0
秒)の場合、高頻度ラベル値組候補「A:p(0),
A:q(+1)」や高頻度ラベル値組候補「A:p
(0),A:r(+2)」が生成され、この高頻度ラベ
ル値組候補の出現頻度がカウントされ、高頻度ラベル値
組候補管理手段11に保持されているこの高頻度ラベル
値組候補の出現頻度が更新される。
For example, the first high-frequency label value A: transmission time constraint satisfaction point C relating to p (medium transmission time between points = 63)
0 second), the label value after 630 seconds from the first point in the label value subsequence is only “C: r”. Since the label value “C: r” is an element of L (1), it is combined with the first high-frequency label value A: p to obtain “A: p (0),
C: r (+2) ”is generated, the appearance frequency of the high-frequency label value set candidate is counted, and the high-frequency label value candidate stored in the high-frequency label value candidate management unit 11 is counted. The appearance frequency of the value set candidate is updated.
Similarly, for example, the transfer time constraint satisfaction point A (the point-to-point medium transfer time = 0) for the first high-frequency label value A: p
Second), the frequent label value set candidate “A: p (0),
A: q (+1) "and the frequent label value set candidate" A: p
(0), A: r (+2) "is generated, the appearance frequency of this high-frequency label value set candidate is counted, and this high-frequency label value set candidate Is updated.

【0093】なお、高頻度ラベル値組候補管理手段11
が保持していない高頻度ラベル値組候補が検出された場
合、新たにその高頻度ラベル値組候補および出現頻度の
保存のための領域を確保してそれらを保持する。
The high-frequency label value set candidate management means 11
If a high-frequency label value set candidate that is not held is detected, an area for storing the high-frequency label value set candidate and the appearance frequency is newly secured and held.

【0094】例えば地点Aに関するラベル値を第1の高
頻度ラベル値とする高頻度ラベル値組候補は、最終的に
次の11個になる。 「A:p(0),A:q(+1)」(出現頻度=1) 「A:p(0),A:r(+2)」(出現頻度=2) 「A:q(0),A:p(+2)」(出現頻度=1) 「A:q(0),A:r(+1)」(出現頻度=1) 「A:r(0),A:p(+1)」(出現頻度=1) 「A:r(0),A:q(+2)」(出現頻度=1) 「A:p(0),C:r(+2)」(出現頻度=2) 「A:q(0),C:p(+2)」(出現頻度=1) 「A:r(0),C:p(+2)」(出現頻度=1) 「A:r(0),B:q(+1)」(出現頻度=1) 「A:r(0),B:t(+2)」(出現頻度=1)
For example, the next 11 high-frequency label value set candidates having the label value relating to the point A as the first high-frequency label value are finally obtained. "A: p (0), A: q (+1)" (frequency of appearance = 1) "A: p (0), A: r (+2)" (frequency of appearance = 2) "A: q (0), “A: p (+2)” (appearance frequency = 1) “A: q (0), A: r (+1)” (appearance frequency = 1) “A: r (0), A: p (+1)” ( Appearance frequency = 1) “A: r (0), A: q (+2)” (appearance frequency = 1) “A: p (0), C: r (+2)” (appearance frequency = 2) “A: q (0), C: p (+2) ”(frequency of appearance = 1)“ A: r (0), C: p (+2) ”(frequency of appearance = 1)“ A: r (0), B: q (+1) "(appearance frequency = 1)" A: r (0), B: t (+2) "(appearance frequency = 1)

【0095】なお、例えば図4における第6番目の時点
のラベル値A:rと第8番目の時点のラベル値C:qと
からは高頻度ラベル値組候補は生成されない。これは第
6番目の時点の代表媒体伝達速度に関する地点Aから地
点Cへの地点間媒体伝達時間が所定の大きな値に設定さ
れるからである。一方、第6番目の時点の代表媒体伝達
速度に関する地点Aから地点Bへの地点間媒体伝達時間
は約268.3秒であり最大伝達時間以下になるので、
第6番目の時点のラベル値A:rに対応して高頻度ラベ
ル値組候補「A:r(0),B:q(+1)」,「A:
r(0),B:t(+2)」が生成される。
For example, a high-frequency label value set candidate is not generated from the label value A: r at the sixth time point and the label value C: q at the eighth time point in FIG. This is because the point-to-point medium transmission time from the point A to the point C regarding the representative medium transmission speed at the sixth time point is set to a predetermined large value. On the other hand, the point-to-point medium transmission time from the point A to the point B regarding the representative medium transmission speed at the sixth time point is about 268.3 seconds, which is shorter than the maximum transmission time.
The high-frequency label value set candidates “A: r (0), B: q (+1)”, “A:” corresponding to the label value A: r at the sixth time point
r (0), B: t (+2) "is generated.

【0096】次に、高頻度ラベル値組抽出手段12は、
生成されたC(2)のうち、出現頻度が所定の下限値以
上である高頻度ラベル値組候補を長さ2の高頻度ラベル
値組(L(2)の要素)として抽出して高頻度ラベル値
組管理手段13に供給する。所定の下限値をL(1)の
抽出の場合と同様に2であるとすると、例えば地点Aに
関するラベル値を第1の高頻度ラベル値とする高頻度ラ
ベル値組候補「A:p(0),A:r(+2)」,
「A:p(0),C:r(+2)」がL(2)の要素と
して抽出され、出現頻度とともに高頻度ラベル値組管理
手段13に保持される。同様にして、「B:q(0),
B:t(+1)」、「C:r(0),C:p(+
1)」、「B:q(0),C:r(+1)」、「B:q
(0),C:p(+2)」および「B:t(0),C:
p(+1)」がL(2)の要素として抽出され高頻度ラ
ベル値組管理手段13に保持される。
Next, the frequent label value set extracting means 12
Of the generated C (2), a high-frequency label value set candidate whose appearance frequency is equal to or higher than a predetermined lower limit value is extracted as a high-frequency label value set of length 2 (element of L (2)) and It is supplied to the label value set management means 13. Assuming that the predetermined lower limit is 2, as in the case of extracting L (1), for example, a high-frequency label value set candidate “A: p (0 ), A: r (+2) ",
“A: p (0), C: r (+2)” is extracted as an element of L (2), and is stored in the high-frequency label value set management unit 13 together with the appearance frequency. Similarly, “B: q (0),
B: t (+1) "," C: r (0), C: p (+
1), “B: q (0), C: r (+1)”, “B: q
(0), C: p (+2) "and" B: t (0), C:
“p (+1)” is extracted as an element of L (2), and is stored in the high-frequency label value set management unit 13.

【0097】次にL(3)の生成について説明する。ラ
ベル値組生成手段14は、L(k)(k>1)から、時
間的に最後のラベル値が同一であり、かつ時間的に最後
のラベル値およびその他の1個のラベル値を除いた長さ
(k−2)のラベル値組が同一である2個の高頻度ラベ
ル値組を抽出し組み合わせて長さ(k+1)の高頻度ラ
ベル値組候補を生成する。上述のL(2)の場合、第1
の条件を満たす2個の高頻度ラベル値組としては、
「A:p(0),C:r(+2)」と「B:q(0),
C:r(+1)」があり、これらの2個の高頻度ラベル
値組は、これらの高頻度ラベル値組から2個のラベル値
を除くといずれも空になるので、第2の条件を満たす。
したがってこれらの高頻度ラベル値組を組み合わせて長
さ3の高頻度ラベル値組候補「A:p(0),B:q
(+1),C:r(+2)」が生成され、高頻度ラベル
値組候補管理手段11に保持される。同様にして長さ3
の高頻度ラベル値組候補「B:q(0),C:r(+
1),C:p(+2)」,「B:t(0),C:r
(0),C:p(+1)」,「B:q(0),B:t
(+1),C:p(+2)」がC(3)の要素として生
成される。
Next, generation of L (3) will be described. The label value set generation means 14 removes the temporally last label value and the temporally last label value and one other label value from L (k) (k> 1). Two high-frequency label value sets having the same length (k-2) label value set are extracted and combined to generate a high-frequency label value set candidate of length (k + 1). In the case of L (2) described above, the first
The two frequent label value pairs that satisfy the condition
“A: p (0), C: r (+2)” and “B: q (0),
C: r (+1) ", and since these two high-frequency label value sets are all empty except for two label values from these high-frequency label value sets, the second condition Fulfill.
Therefore, by combining these frequent label value sets, the frequent label value set candidate “A: p (0), B: q
(+1), C: r (+2) "is generated and held in the high-frequency label value set candidate management unit 11. Length 3 in the same way
Of the high-frequency label value set candidates “B: q (0), C: r (+
1), C: p (+2) "," B: t (0), C: r
(0), C: p (+1) "," B: q (0), B: t
(+1), C: p (+2) "is generated as an element of C (3).

【0098】ラベル値組検証手段10はC(3)の要素
をラベル値系列で検索し、検出すると、そのC(3)の
要素である高頻度ラベル値組候補についてラベル値間制
約判定手段7により上述の制約条件を満足すると判定さ
れた場合にのみ、検出されたC(3)の要素の出現頻度
をカウントし、それに応じて高頻度ラベル値組候補管理
手段11は保持している出現頻度を更新する。
The label value set verification means 10 searches the element of C (3) in the label value series and detects it, and if it detects the high frequency label value set candidate which is the element of C (3), the label value constraint determination means 7 Only when it is determined that the above-mentioned constraint condition is satisfied, the appearance frequency of the detected element of C (3) is counted, and the high-frequency label value set candidate management unit 11 accordingly stores the appearance frequency To update.

【0099】ここで一例として長さ3の高頻度ラベル値
組候補「B:q(0),B:t(+1),C:p(+
2)」についてのラベル値間制約判定手段7による判定
について説明する。
Here, as an example, a high-frequency label value set candidate “B: q (0), B: t (+1), C: p (+
The determination of “2)” by the label value constraint determination unit 7 will be described.

【0100】高頻度ラベル値組候補「B:q(0),
B:t(+1),C:p(+2)」は図4においてまず
第2番目の時点から第4番目の時点までにおいて出現す
る。このとき、2ラベル値組「B:q(0),C:p
(+2)」については、ラベル値B:q(0)の出現時
点は第2番目の時点であり、そのときの代表媒体伝達速
度に関する地点Bから地点Cへの地点間媒体伝達時間は
上述のように570秒である。したがって、ラベル値
B:q(0)の出現時点とラベル値C:p(+2)の出
現時点との時間差(=1200秒)が第2番目の時点に
おける代表媒体伝達速度に関する地点Bから地点Cへの
地点間媒体伝達時間(=570秒)以上であるので、こ
の2ラベル値組については制約条件を満足する。同様
に、2ラベル値組「B:t(+1),C:p(+2)」
についても制約条件を満足する。したがって、この時点
で検出された高頻度ラベル値組候補「B:q(0),
B:t(+1),C:p(+2)」について、上述の制
約条件を満足すると判定される。
The frequent label value set candidate “B: q (0),
B: t (+1), C: p (+2) "first appears in FIG. 4 from the second time point to the fourth time point. At this time, the two label value set “B: q (0), C: p
(+2) ", the label value B: q (0) is present at the second time point, and the point-to-point medium transmission time from point B to point C relating to the representative medium transmission speed at that time is as described above. 570 seconds. Therefore, the time difference (= 1200 seconds) between the label value B: q (0) output time and the label value C: p (+2) output time is changed from the point B to the point C relating to the representative medium transmission speed at the second time point. Since the medium transmission time between points is equal to or longer than (570 seconds), this two-label value set satisfies the constraint condition. Similarly, a two-label value set “B: t (+1), C: p (+2)”
Also satisfies the constraint condition. Therefore, the high-frequency label value set candidate “B: q (0),
B: t (+1), C: p (+2) "are determined to satisfy the above-described constraint conditions.

【0101】図4において次に高頻度ラベル値組候補
「B:q(0),B:t(+1),C:p(+2)」は
第7番目の時点から第9番目の時点までにおいて出現す
る。このとき、2ラベル値組「B:q(0),C:p
(+2)」については、ラベル値B:q(0)の出現時
点は第7番目の時点であり、そのときの代表媒体伝達速
度に関する地点Bから地点Cへの地点間媒体伝達時間は
上述のように所定の大きな値である。したがって、ラベ
ル値B:q(0)の出現時点とラベル値C:p(+2)
の出現時点との時間差(=1200秒)が第7番目の時
点における代表媒体伝達速度に関する地点Bから地点C
への地点間媒体伝達時間(=所定の大きな値)以上では
ないので、この2ラベル値組については制約条件を満足
しない。したがって、この時点で検出された高頻度ラベ
ル値組候補「B:q(0),B:t(+1),C:p
(+2)」については、上述の制約条件を満足しないと
判定される。
In FIG. 4, the next most frequent label value set candidate “B: q (0), B: t (+1), C: p (+2)” is calculated from the seventh time to the ninth time. Appear. At this time, the two label value set “B: q (0), C: p
(+2) ", the label value B: q (0) is output at the seventh time, and the point-to-point medium transmission time from point B to point C relating to the representative medium transmission speed at that time is as described above. This is a predetermined large value. Therefore, the label value B: q (0) and the label value C: p (+2)
The time difference (= 1200 seconds) from the point B to the point C relating to the representative medium transmission speed at the seventh point in time.
Since this is not longer than the point-to-point medium transmission time (= predetermined large value), the two label value set does not satisfy the constraint. Therefore, the high-frequency label value set candidate “B: q (0), B: t (+1), C: p
(+2) "is determined not to satisfy the above-described constraint condition.

【0102】このようにして、最終的にラベル値系列で
のC(3)の要素の出現頻度が算出される。高頻度ラベ
ル値組候補「B:q(0),B:t(+1),C:p
(+2)」の場合、出現頻度は1となる。そして高頻度
ラベル値組抽出手段12はC(3)のうち、出現頻度が
所定の下限値以上である高頻度ラベル値組候補を長さ3
の高頻度ラベル値組(L(3)の要素)として抽出し、
高頻度ラベル値組管理手段13に供給する。
In this way, the appearance frequency of the element of C (3) in the label value series is finally calculated. High frequency label value set candidate “B: q (0), B: t (+1), C: p
(+2) ", the appearance frequency is 1. Then, the frequent label value set extraction unit 12 extracts the frequent label value set candidates whose appearance frequency is equal to or more than the predetermined lower limit value from C (3) to the length 3.
As a high-frequency label value set (element of L (3))
It is supplied to the high-frequency label value set management means 13.

【0103】所定の下限値が2であるとすると、高頻度
ラベル値組候補「B:q(0),B:t(+1),C:
p(+2)」の出現頻度は1であるので、長さ3の高頻
度ラベル値組とされない。また、他の高頻度ラベル値組
候補「A:p(0),B:q(+1),C:r(+
2)」,「B:q(0),C:r(+1),C:p(+
2)」,「B:t(0),C:r(0),C:p(+
1)」の出現頻度はそれぞれ2、2および1となるの
で、高頻度ラベル値組候補「A:p(0),B:q(+
1),C:r(+2)」および高頻度ラベル値組候補
「B:q(0),C:r(+1),C:p(+2)」が
長さ3の高頻度ラベル値組として抽出され、高頻度ラベ
ル値組管理手段13に保持される。
Assuming that the predetermined lower limit is 2, the frequent label value set candidate “B: q (0), B: t (+1), C:
Since the appearance frequency of “p (+2)” is 1, it is not set as a high-frequency label value set of length 3. Further, the other high-frequency label value set candidates “A: p (0), B: q (+1), C: r (+
2) "," B: q (0), C: r (+1), C: p (+
2) "," B: t (0), C: r (0), C: p (+
1) are 2, 2 and 1, respectively, so that the high-frequency label value set candidates “A: p (0), B: q (+
1), C: r (+2) "and the frequent label value set candidate" B: q (0), C: r (+1), C: p (+2) "as the frequent label value set of length 3 It is extracted and stored in the high-frequency label value set management unit 13.

【0104】次に、ラベル値組生成手段14はC(4)
の要素の生成を試みるが、L(3)の要素である「A:
p(0),B:q(+1),C:r(+2)」および
「B:q(0),C:r(+1),C:p(+2)」に
おける時間的に最後のラベル値(C:pとC:r)が同
一ではないので、C(4)の要素を生成することができ
ない。したがってC(4)は空となり、L(4)も空に
なるので、高頻度ラベル値組の生成はL(3)までで終
了する。なお、以上の説明では高頻度ラベル値組生成の
際の出現頻度の下限値を一律に2としているが、この下
限値は高頻度ラベル値組の長さに応じて変化させてもよ
い。
Next, the label value set generating means 14 sets C (4)
Of the element of L (3), "A:
p (0), B: q (+1), C: r (+2) "and" B: q (0), C: r (+1), C: p (+2) ", the temporally last label value Since (C: p and C: r) are not the same, the element of C (4) cannot be generated. Therefore, C (4) becomes empty and L (4) becomes empty, so that the generation of the high-frequency label value set ends up to L (3). In the above description, the lower limit of the frequency of appearance at the time of generating a high-frequency label value set is uniformly set to 2, but the lower limit may be changed according to the length of the high-frequency label value set.

【0105】そしてルール抽出手段15は、例えば高頻
度ラベル値組「A:p(0),B:q(+1),C:r
(+2)」からルール候補「A:p(0),B:q(+
1)→C:r(+2)」を生成する。このルール候補の
条件部に対応するラベル値組「A:p(0),B:q
(+1)」は高頻度ラベル値組ではないため、新たに出
現頻度を算出する必要がある。この場合、条件部および
結論部に対応する高頻度ラベル値組によって張られる時
間幅は、ラベル値「A:p」の時点で開始してラベル値
「C:r」の時点で終了する2単位時間であるため、ラ
ベル値系列の最後の2個分の時点(つまり、図4におけ
る第8番目の時点と第9番目の時点)のいずれかを開始
点とするようなラベル値組の出現を除外して出現頻度を
算出する。したがってラベル値組「A:p(0),B:
q(+1)」の出現頻度は2と算出される。
Then, the rule extracting means 15 outputs, for example, the frequent label value set “A: p (0), B: q (+1), C: r
(+2) ”and rule candidates“ A: p (0), B: q (+
1) → C: r (+2) "is generated. The label value set “A: p (0), B: q” corresponding to the condition part of this rule candidate
(+1) "is not a high-frequency label value set, so it is necessary to calculate a new appearance frequency. In this case, the time width spanned by the high-frequency label value sets corresponding to the condition part and the conclusion part is two units starting at the label value “A: p” and ending at the label value “C: r”. Because of the time, the appearance of a label value set whose start point is one of the last two time points of the label value series (that is, the eighth time point and the ninth time point in FIG. 4). Exclude and calculate the appearance frequency. Therefore, the label value set “A: p (0), B:
The appearance frequency of “q (+1)” is calculated as 2.

【0106】次にルール抽出手段15は、条件部が出現
する割合と高頻度ラベル値全体が出現する割合との比を
求める。ルール候補「A:p(0),B:q(+1)→
C:r(+2)」の場合、条件部に対応するラベル値組
の出現頻度は2であり、また条件部および結論部に対応
する高頻度ラベル値組の出現頻度も上述のように2であ
る。したがって当該割合は100%である。
Next, the rule extracting means 15 obtains the ratio of the ratio of the occurrence of the condition part to the ratio of the entire high-frequency label value. Rule candidate “A: p (0), B: q (+1) →
In the case of "C: r (+2)", the appearance frequency of the label value set corresponding to the condition part is 2, and the appearance frequency of the high-frequency label value set corresponding to the condition part and the conclusion part is also 2 as described above. is there. Therefore, the ratio is 100%.

【0107】そしてルール抽出手段15は、この割合が
所定の下限値以上であるようなルール候補をif−th
en形式のルールとして抽出し出力する。例えば所定の
下限値が80%である場合、ルール候補「A:p
(0),B:q(+1)→C:r(+2)」の当該割合
は100%であるので、if−then形式のルールと
して出力される。同様にして、ルール「B:q(0),
C:r(+1)→C:p(+2)」も抽出される。
Then, the rule extracting means 15 determines a rule candidate whose ratio is equal to or more than a predetermined lower limit value if-th.
Extract and output as rules in en format. For example, if the predetermined lower limit is 80%, the rule candidate “A: p
Since the ratio of “(0), B: q (+1) → C: r (+2)” is 100%, it is output as an if-then rule. Similarly, the rule “B: q (0),
C: r (+1) → C: p (+2) ”is also extracted.

【0108】以上のように、この実施の形態1によれ
ば、空間の複数地点で取得されたラベル値の時系列デー
タから、時刻とともに変化する媒体伝達速度に基づいて
地点間を影響が伝達する時間を考慮して高頻度で出現す
るラベル値のパターンを抽出するようにしたので、地点
間の媒体伝達時間による制約のために依存関係がないと
判断されるルールを除いて時間的な相関ルールを抽出す
ることができるという効果が得られる。すなわち、地点
間の媒体伝達時間による制約のために依存関係がない無
意味なパターンが生成されないという効果が得られる。
また、無意味なパターンが生成されないので、ルール抽
出のための処理時間を短縮することができるという効果
が得られる。
As described above, according to the first embodiment, the influence is transmitted between the points based on the medium transmission speed that changes with time from the time-series data of the label values acquired at a plurality of points in the space. Since the pattern of label values that appear at high frequency is extracted in consideration of time, temporal correlation rules are excluded except for rules that are determined to have no dependencies due to restrictions on medium transmission time between points. Can be obtained. In other words, there is an effect that a meaningless pattern having no dependency is not generated due to the restriction due to the medium transmission time between points.
Further, since a meaningless pattern is not generated, an effect is obtained that the processing time for rule extraction can be reduced.

【0109】また、この実施の形態1によれば、地点間
の距離を地点の緯度と経度から計算する場合、媒体の高
度方向への伝達に要する時間を無視できる際には適切な
地点間媒体伝達時間を得ることができ、地点間の距離を
地点の緯度、経度および高度から計算する場合、媒体の
高度方向への伝達に要する時間を無視できなくても適切
な地点間媒体伝達時間を得ることができるという効果が
得られる。
According to the first embodiment, when calculating the distance between the points from the latitude and longitude of the point, if the time required for transmitting the medium in the altitude direction can be neglected, the appropriate point-to-point medium Transmission time can be obtained, and when calculating the distance between points from the latitude, longitude, and altitude of a point, an appropriate point-to-point medium transmission time can be obtained even if the time required for transmission of the medium in the altitude direction cannot be ignored. The effect that it can be obtained is obtained.

【0110】さらに、この実施の形態1によれば、2地
点間の距離およびその2地点を結ぶ半直線と代表媒体伝
達速度の向きとのなす角度に基づいて地点間媒体伝達時
間を計算するようにしたので、媒体の移動を考慮した適
切な地点間媒体伝達時間を計算することができるという
効果が得られる。
Furthermore, according to the first embodiment, the point-to-point medium transmission time is calculated based on the distance between the two points and the angle between the half-line connecting the two points and the direction of the representative medium transmission speed. Therefore, it is possible to obtain an effect that an appropriate point-to-point medium transmission time can be calculated in consideration of the movement of the medium.

【0111】さらに、この実施の形態1によれば、2地
点を結ぶ半直線と代表媒体伝達速度の向きとのなす角度
が所定の範囲内に存在するか否かを判定して地点間の媒
体の移動の有無を判定するようにしたので、地点間媒体
伝達時間を簡単にかつ適切に計算することができるとい
う効果が得られる。
Further, according to the first embodiment, it is determined whether or not the angle formed by the half line connecting the two points and the direction of the representative medium transmission speed is within a predetermined range, and the medium between the points is determined. Since the presence / absence of the movement of the point is determined, it is possible to easily and appropriately calculate the medium transmission time between points.

【0112】さらに、この実施の形態1によれば、ラベ
ル値部分系列ごとに、最初の時点におけるラベル値から
第1の高頻度ラベル値を抽出した後に、媒体の伝達時間
に関する制約を満たす第2の高頻度ラベル値を抽出し、
第1および第2の高頻度ラベル値を組み合わせて長さ2
の高頻度ラベル値組候補を生成するようにしたので、媒
体伝達時間に関する制約を満たした長さ2の高頻度ラベ
ル値組候補を簡単に生成することができるという効果が
得られる。
Further, according to the first embodiment, for each label value subsequence, after extracting the first high-frequency label value from the label value at the first time, the second high-frequency label value satisfying the constraint on the transmission time of the medium is obtained. Extract the frequent label values of
Combining the first and second frequent label values to length 2
Since the high-frequency label value set candidate is generated, it is possible to easily generate a high-frequency label value set candidate having a length of 2 that satisfies the restriction on the medium transmission time.

【0113】実施の形態2.図9はこの発明の実施の形
態2によるデータマイニング装置の構成を示すブロック
図である。図において、41は各代表媒体伝達速度の、
第1の地点と第2の地点を結ぶ直線の方向の成分を距離
方向速度として計算する距離方向速度算出手段である。
なお、図9におけるその他の構成要素については実施の
形態1によるものと同様であるので、その説明を省略す
る。ただし、距離対媒体速度比算出手段25は、代表媒
体伝達速度の代わりに、距離方向速度算出手段41によ
り計算された距離方向速度を使用する。
Embodiment 2 FIG. 9 is a block diagram showing a configuration of a data mining device according to Embodiment 2 of the present invention. In the figure, 41 is the representative medium transmission speed,
Distance direction speed calculating means for calculating a component in a direction of a straight line connecting the first point and the second point as a distance direction speed.
The other components in FIG. 9 are the same as those according to the first embodiment, and a description thereof will not be repeated. However, the distance-to-medium speed ratio calculating means 25 uses the distance direction speed calculated by the distance direction speed calculating means 41 instead of the representative medium transmission speed.

【0114】次に動作について説明する。図10は代表
媒体伝達速度と距離方向速度との対応関係を示す図であ
る。距離方向速度算出手段41は、角度差算出手段21
により計算された角度差および対応関係保持手段2に保
持された対応関係に基づいて、対応関係に現れる各代表
媒体伝達速度の、第1の地点と第2の地点を結ぶ直線の
方向の成分を距離方向速度として計算する。
Next, the operation will be described. FIG. 10 is a diagram showing the correspondence between the representative medium transmission speed and the distance direction speed. The distance direction speed calculating means 41 is the angle difference calculating means 21.
Based on the angle difference calculated by the above and the correspondence held in the correspondence holding means 2, the component of the direction of the straight line connecting the first point and the second point of each representative medium transmission speed appearing in the correspondence is calculated. Calculate as distance speed.

【0115】例えば図10においては、距離方向速度
は、代表媒体伝達速度のベクトルを第1および第2の地
点A,Bを通過する直線ABに射影して算出される。す
なわち、距離方向速度は、角度差の余弦に代表媒体伝達
速度の大きさを乗じて計算される。このとき、距離方向
速度が正である場合、距離方向速度の向きは、第1の地
点を起点として第2の地点を通る半直線の向きと一致す
る。一方、距離方向速度が負である場合、距離方向速度
の向きは、第2の地点を起点として第1の地点を通る半
直線の向きと一致する。
For example, in FIG. 10, the distance direction velocity is calculated by projecting the vector of the representative medium transmission velocity onto a straight line AB passing through the first and second points A and B. That is, the distance direction velocity is calculated by multiplying the cosine of the angle difference by the magnitude of the representative medium transmission velocity. At this time, when the distance direction speed is positive, the direction of the distance direction speed coincides with the direction of a half-line passing through the second point from the first point. On the other hand, when the distance direction speed is negative, the direction of the distance direction speed coincides with the direction of a half-line passing through the first point from the second point.

【0116】そして距離対媒体速度比算出手段25は、
距離算出手段22により計算された地点間距離、距離方
向速度算出手段41により計算された距離方向速度に基
づいて、第1の地点を起点として第2の地点を通る半直
線と距離方向速度の向きとが一致する場合には、地点間
の距離と距離方向速度の大きさの比を第1の地点から第
2の地点への地点間媒体伝達時間として算出し、両者が
一致しない場合には、第1の地点から第2の地点への地
点間媒体伝達時間を所定の大きな値とする。また、距離
対媒体速度比算出手段25は、第2の地点を起点として
第1の地点を通る半直線と距離方向速度の向きとが一致
する場合には、地点間の距離と距離方向速度の大きさの
比を第2の地点から第1の地点への地点間媒体伝達時間
として算出し、両者が一致しない場合には、第2の地点
から第1の地点への地点間媒体伝達時間を所定の大きな
値に設定する。
The distance to medium speed ratio calculating means 25
Based on the point-to-point distance calculated by the distance calculating means 22 and the distance direction speed calculated by the distance direction speed calculating means 41, the direction of the half-line passing through the second point from the first point and the direction of the distance direction speed If the two coincide, the ratio between the distance between the points and the magnitude of the distance direction velocity is calculated as the point-to-point medium transmission time from the first point to the second point. The point-to-point medium transmission time from the first point to the second point is a predetermined large value. Further, the distance-to-medium speed ratio calculating means 25 calculates the distance between the points and the distance direction speed when the direction of the distance direction speed coincides with the half line passing through the first point starting from the second point. The ratio of the magnitudes is calculated as the point-to-point medium transmission time from the second point to the first point. If the two do not match, the point-to-point medium transmission time from the second point to the first point is calculated. Set to a predetermined large value.

【0117】例えば図10に示す地点A,Bおよび代表
媒体伝達速度の場合、距離方向速度の向きは、地点Aを
起点として地点Bを通る半直線の向きと一致するので、
地点Aから地点Bへの地点間媒体伝達時間は、地点AB
間の距離を距離方向速度の大きさで除算して計算され
る。一方、地点Bから地点Aへの地点間媒体伝達時間は
所定の大きな値に設定される。
For example, in the case of the points A and B and the representative medium transmission speed shown in FIG. 10, the direction of the distance direction speed coincides with the direction of the half line passing through the point B starting from the point A.
The point-to-point medium transmission time from point A to point B is point AB
It is calculated by dividing the distance by the magnitude of the speed in the distance direction. On the other hand, the point-to-point medium transmission time from point B to point A is set to a predetermined large value.

【0118】なお、その他の動作については実施の形態
1によるものと同様であるので、その説明を省略する。
The other operations are the same as those according to the first embodiment, and the description is omitted.

【0119】以上のように、この実施の形態2によれ
ば、各代表媒体伝達速度の、2つの地点を結ぶ直線方向
の成分を距離方向速度として計算し、代表媒体伝達速度
の代わりに使用して地点間媒体伝達時間を計算するよう
にしたので、地点間媒体伝達時間をより適切に計算する
ことができるという効果が得られる。
As described above, according to the second embodiment, the component of each representative medium transmission speed in the linear direction connecting two points is calculated as the distance direction speed, and is used instead of the representative medium transmission speed. Since the point-to-point medium transmission time is calculated in this way, the effect that the point-to-point medium transmission time can be more appropriately calculated is obtained.

【0120】実施の形態3.図11はこの発明の実施の
形態3によるデータマイニング装置の構成を示すブロッ
ク図である。図において、51は媒体伝達速度が各地点
毎に得られている場合に、各地点対の2地点にそれぞれ
対応する2つの媒体伝達速度から地点間代表速度を計算
して媒体伝達速度系列を地点間代表速度系列に変換する
地点間代表速度系列算出手段である。なお、図11にお
けるその他の構成要素については実施の形態1によるも
のと同様であるので、その説明を省略する。ただし、媒
体伝達速度は各地点毎に設定されており、媒体速度分類
手段6は、媒体伝達速度系列の代わりに地点間代表速度
系列を使用する。
Embodiment 3 FIG. 11 is a block diagram showing a configuration of a data mining device according to Embodiment 3 of the present invention. In the figure, when a medium transmission speed is obtained for each point, a point-to-point representative speed is calculated from two medium transmission speeds corresponding to two points of each point pair, and a medium transmission speed series is indicated by a point 51. This is a point-to-point representative speed sequence calculation unit that converts the data into an inter-point representative speed sequence. The other components in FIG. 11 are the same as those according to the first embodiment, and a description thereof will not be repeated. However, the medium transmission speed is set for each point, and the medium speed classification means 6 uses a point-to-point representative speed sequence instead of the medium transmission speed sequence.

【0121】次に動作について説明する。図12は2地
点の媒体伝達速度と地点間代表速度との対応関係を示す
図である。地点間代表速度系列算出手段51は、媒体伝
達速度系列保持手段5に保持された各地点に関する媒体
伝達速度系列を読み込み、各地点対のそれぞれの地点に
対応する2つの媒体伝達速度に基づいて地点間代表速度
を計算して、媒体伝達速度系列を地点間代表速度系列に
変換する。
Next, the operation will be described. FIG. 12 is a diagram showing the correspondence between the medium transmission speed at two points and the representative speed between points. The point-to-point representative speed sequence calculating means 51 reads the medium transmission speed sequence for each point held in the medium transmission speed sequence holding means 5 and stores a point based on the two medium transmission speeds corresponding to each point of each point pair. The medium representative speed sequence is calculated to convert the medium transmission speed sequence into a point-to-point representative speed sequence.

【0122】例えば地点Aと地点Bの媒体伝達速度が図
12(a)に示すようである場合、地点Aに対応する媒
体伝達速度と地点Bに対応する媒体伝達速度に基づい
て、例えば図12(b)に示すように、2つの媒体伝達
速度を表すベクトルの和に0.5を乗算して地点Aと地
点Bに関する地点間代表速度が計算される。
For example, when the medium transmission speeds at the point A and the point B are as shown in FIG. 12A, based on the medium transmission speed corresponding to the point A and the medium transmission speed corresponding to the point B, for example, as shown in FIG. As shown in (b), the point-to-point representative speed for the points A and B is calculated by multiplying the sum of the vectors representing the two medium transmission speeds by 0.5.

【0123】媒体速度分類手段6は、媒体伝達速度系列
の代わりに地点間代表速度系列を使用して、対応関係保
持手段2に保持された対応関係に基づいて代表媒体伝達
速度系列を生成する。
The medium speed classifying means 6 uses the point-to-point representative speed sequence instead of the medium transmission speed sequence, and generates a representative medium transmission speed sequence based on the correspondence held in the correspondence holding means 2.

【0124】なお、その他の動作については実施の形態
1によるものと同様であるので、その説明を省略する。
The other operations are the same as those in the first embodiment, and the description thereof will not be repeated.

【0125】以上のように、この実施の形態3によれ
ば、各地点にそれぞれ媒体伝達速度が付与されている場
合に、地点対毎に、その地点対の2つの地点にそれぞれ
対応する媒体伝達速度に基づいて地点間代表速度を計算
し、媒体伝達速度の代わりに地点間代表速度を使用する
ようにしたので、地点間媒体伝達時間をより適切に計算
することができるという効果が得られる。
As described above, according to the third embodiment, when the medium transmission speed is given to each point, for each point pair, the medium transmission speed corresponding to each of the two points of the point pair is obtained. Since the point-to-point representative speed is calculated based on the speed and the point-to-point representative speed is used instead of the medium transmission speed, an effect that the point-to-point medium transmission time can be more appropriately calculated can be obtained.

【0126】実施の形態4.図13はこの発明の実施の
形態4によるデータマイニング装置の構成を示すブロッ
ク図である。図において、61は媒体伝達速度系列を構
成する各時点における媒体伝達速度を、その媒体伝達速
度およびその近傍の1つまたは複数の時点における媒体
伝達速度の平均に変換して媒体伝達速度系列を平滑化媒
体伝達速度系列に変換する媒体速度系列平滑化手段であ
る。なお、図13におけるその他の構成要素については
実施の形態1によるものと同様であるので、その説明を
省略する。ただし、媒体速度分類手段6は、媒体伝達速
度系列の代わりに、媒体速度系列平滑化手段61により
変換された平滑化媒体伝達速度系列を使用する。
Embodiment 4 FIG. 13 is a block diagram showing a configuration of a data mining device according to Embodiment 4 of the present invention. In the figure, reference numeral 61 denotes a medium transmission speed sequence which is converted at each point in the medium transmission speed sequence into an average of the medium transmission speed and the medium transmission speed at one or more time points in the vicinity thereof to smooth the medium transmission speed sequence. Medium speed series smoothing means for converting into a converted medium transmission speed series. The other components in FIG. 13 are the same as those according to the first embodiment, and a description thereof will not be repeated. However, the medium speed classification means 6 uses the smoothed medium transmission speed sequence converted by the medium speed sequence smoothing means 61 instead of the medium transmission speed sequence.

【0127】次に動作について説明する。図14は平滑
化媒体伝達速度系列の一例を示す図であり、図15は図
14の平滑化媒体伝達速度系列より生成された代表媒体
伝達速度系列の一例を示す図である。媒体速度系列平滑
化手段61は、媒体伝達速度系列保持手段5に保持され
た媒体伝達速度系列を構成する各時点における媒体伝達
速度を、その媒体伝達速度およびその近傍の時点におけ
る1つまたは複数の媒体伝達速度の平均に変換して媒体
伝達速度系列を平滑化媒体伝達速度系列に変換し、平滑
化媒体伝達速度系列を媒体速度分類手段6に供給する。
なお、媒体伝達速度の角度の平均を計算する際には、ま
ずそれらの角度にそれぞれ必要に応じて360度を加算
して、最大の角度から最小の角度を減算した値が180
度未満になるようにする。これが不可能な場合には角度
に関する平滑化を行わない。360度加算後において、
最大の角度から最小の角度を減算した値が180度未満
になった場合、それらの角度の和をその媒体伝達速度の
数で除算することにより平均を計算する。例えば355
度と5度の平均を計算する場合を考える。これらの角度
の差は350度であるので、5度に360度を加算して
365度とする。すると355度との角度の差が10度
となり180度未満であるので、365度と355度と
の平均を計算することにより、360度すなわち0度
が、355度と5度の平均として得られる。
Next, the operation will be described. FIG. 14 is a diagram showing an example of a smoothed medium transmission speed sequence, and FIG. 15 is a diagram showing an example of a representative medium transmission speed sequence generated from the smoothed medium transmission speed sequence of FIG. The medium speed sequence smoothing means 61 compares the medium transmission speed at each time constituting the medium transmission speed sequence held by the medium transmission speed sequence holding means 5 with one or more of the medium transmission speed and a time near the medium transmission speed. The medium transmission speed sequence is converted into an average of the medium transmission speeds to convert it to a smoothed medium transmission speed sequence, and the smoothed medium transmission speed sequence is supplied to the medium speed classification means 6.
When calculating the average of the angles of the medium transmission speed, first, 360 degrees are added to the angles as necessary, and the value obtained by subtracting the minimum angle from the maximum angle is 180.
Less than degrees. If this is not possible, no angle smoothing is performed. After adding 360 degrees,
If the value obtained by subtracting the minimum angle from the maximum angle is less than 180 degrees, the average is calculated by dividing the sum of those angles by the number of the medium transmission speed. For example, 355
Consider the case of calculating the average of degrees and five degrees. Since the difference between these angles is 350 degrees, 360 degrees is added to 5 degrees to obtain 365 degrees. Then, the difference between the angle of 355 ° and the angle is 10 °, which is less than 180 °. By calculating the average of 365 ° and 355 °, 360 °, that is, 0 ° is obtained as the average of 355 ° and 5 °. .

【0128】例えば図3に示す媒体伝達速度系列に基づ
いて、各時点における媒体伝達速度とその次の時点にお
ける媒体伝達速度の平均を計算して平滑化媒体伝達速度
系列を生成する場合、その平滑化媒体伝達速度系列は図
14に示すようになる。例えば、図3における第1番目
の時点および第2番目の時点における媒体伝達速度の向
きは10および15であるので、平滑化媒体伝達速度系
列のうちの第1番目の時点における速度の向きは10と
15の平均である12.5となる。なお、図14におい
ては、図3における第10番目の時点における媒体伝達
速度が第9番目の時点のものと同一であるものとしてい
る。
For example, when calculating the average of the medium transmission speed at each time and the medium transmission speed at the next time based on the medium transmission speed sequence shown in FIG. 3, a smoothed medium transmission speed sequence is generated. The converted medium transmission speed sequence is as shown in FIG. For example, since the directions of the medium transmission speed at the first time point and the second time point in FIG. 3 are 10 and 15, the direction of the speed at the first time point in the smoothed medium transmission speed series is 10 and 15, respectively. And 12.5 which is the average of 15. In FIG. 14, the medium transmission speed at the tenth time point in FIG. 3 is the same as that at the ninth time point.

【0129】媒体速度分類手段6は、媒体伝達速度系列
の代わりに媒体速度系列平滑化手段61により変換され
た平滑化媒体伝達速度系列を使用して、対応関係保持手
段2に保持された対応関係に基づいて代表媒体伝達速度
系列を生成する。例えば図14に示す平滑化媒体伝達速
度系列が供給され、図5(a),(b)に示す対応関係
に基づいて代表媒体伝達速度系列を生成する場合、媒体
速度分類手段6は図15に示す代表媒体伝達速度系列を
生成する。
The medium speed classifying means 6 uses the smoothed medium transmission speed series converted by the medium speed series smoothing means 61 instead of the medium transmission speed series, and uses the correspondence held in the correspondence holding means 2. , A representative medium transmission speed sequence is generated. For example, when the smoothed medium transmission speed sequence shown in FIG. 14 is supplied and a representative medium transmission speed sequence is generated based on the correspondence shown in FIGS. 5 (a) and 5 (b), the medium speed classifying means 6 shown in FIG. A representative medium transmission speed sequence shown is generated.

【0130】以上のように、この実施の形態4によれ
ば、媒体伝達速度系列を構成する各時点における媒体伝
達速度を、その媒体伝達速度およびその近傍の1つまた
は複数の時点における媒体伝達速度の平均に変換して媒
体伝達速度系列を平滑化媒体伝達速度系列に変換し、媒
体伝達速度系列の代わりに平滑化媒体伝達速度系列を使
用するようにしたので、その複数の媒体伝達速度の性質
を組み込んだ平滑化後の媒体伝達速度でラベル値間の制
約条件の判定がされ、より適切な判定を実行することが
できるという効果が得られる。
As described above, according to the fourth embodiment, the medium transmission speed at each time of forming the medium transmission speed sequence is calculated by using the medium transmission speed and the medium transmission speed at one or more nearby times. The average of the medium transmission speed series is converted to a smoothed medium transmission speed series, and the smoothed medium transmission speed series is used instead of the medium transmission speed series. The constraint between the label values is determined based on the smoothed medium transmission speed incorporating the above, and an effect is obtained that a more appropriate determination can be executed.

【0131】実施の形態5.図16はこの発明の実施の
形態5によるデータマイニング装置の構成を示すブロッ
ク図である。図において、71はラベル値部分系列抽出
手段31により抽出されるラベル値部分系列から予め指
定された要素に対応するものを抽出する要素指定抽出手
段である。なお、図16におけるその他の構成要素につ
いては実施の形態1によるものと同様であるので、その
説明を省略する。ただし、ラベル値対抽出手段34は、
ラベル値部分系列抽出手段31により抽出されたラベル
値部分系列の代わりに、要素指定抽出手段71により抽
出された系列を使用する。
Embodiment 5 FIG. FIG. 16 is a block diagram showing a configuration of a data mining device according to Embodiment 5 of the present invention. In the figure, reference numeral 71 denotes an element designation extracting means for extracting a label value partial series extracted by the label value partial series extracting means 31 corresponding to an element designated in advance. The other components in FIG. 16 are the same as those according to the first embodiment, and a description thereof will not be repeated. However, the label value pair extraction means 34
Instead of the label value subsequence extracted by the label value subsequence extraction means 31, the series extracted by the element designation extraction means 71 is used.

【0132】次に動作について説明する。図17は地点
A,B,Cにおいて得られたラベル値系列の他の例を示
す図であり、図18はラベル値部分系列抽出手段31に
より抽出されたラベル値部分系列の一例を示す図であ
り、図19は要素指定抽出手段71により抽出されたラ
ベル値部分系列の一例を示す図である。
Next, the operation will be described. FIG. 17 is a diagram showing another example of the label value series obtained at points A, B, and C. FIG. 18 is a diagram showing an example of the label value subsequence extracted by the label value subsequence extracting means 31. FIG. 19 is a diagram showing an example of a label value subsequence extracted by the element designation extraction unit 71.

【0133】図17において、地点A,B,Cは各地点
を表し、a,bはそれぞれ保持するラベル値の要素を表
す。ラベル値対生成手段9のラベル値部分系列抽出手段
31は例えば図17に示すラベル値系列のうち所定の時
間幅に含まれる部分をラベル値部分系列として抽出す
る。例えば所定の時間幅が2単位時間(今の場合、12
00秒)である場合、図17のラベル値系列に対する第
1番目のラベル値部分系列は図18に示すようになる。
このとき、所定の時間幅である2単位時間の開始時点と
終了時点のラベル値を両方とも同一のラベル値部分系列
に含めるものとする。
In FIG. 17, points A, B, and C represent respective points, and a and b represent elements of the label values held respectively. The label value subsequence extracting means 31 of the label value pair generating means 9 extracts, for example, a part included in a predetermined time width from the label value series shown in FIG. 17 as a label value subsequence. For example, the predetermined time width is 2 unit times (in this case, 12
00 second), the first label value subsequence for the label value sequence in FIG. 17 is as shown in FIG.
At this time, it is assumed that both the label values at the start time and the end time of the two unit times having a predetermined time width are included in the same label value subsequence.

【0134】そして要素指定抽出手段71は、ラベル値
部分系列抽出手段31により抽出されたラベル値部分系
列から予め指定された要素に対応する部分を抽出してラ
ベル値対抽出手段34に供給する。ラベル値対抽出手段
34は、要素指定抽出手段71からのラベル値部分系
列、高頻度ラベル値検出手段32により検出された第1
の高頻度ラベル値、地点抽出手段33により抽出された
伝達時間制約満足地点およびその地点間媒体伝達時間、
並びに高頻度ラベル値組管理手段13に保持された高頻
度ラベル値の集合L(1)に基づいて、伝達時間制約満
足地点に関するラベル値のうち、要素指定抽出手段71
からのラベル値部分系列の最初の時点を基準として、そ
の地点に対応する地点間媒体伝達時間以降のラベル値で
あり、かつL(1)の要素であるラベル値を第2の高頻
度ラベル値とし、第1の高頻度ラベル値と第2の高頻度
ラベル値、並びに両者の地点および両者間の時間差より
長さ2の高頻度ラベル値組候補を生成し、高頻度ラベル
値組候補管理手段11におけるその高頻度ラベル値組候
補の出現頻度が更新される。
Then, the element designation extracting means 71 extracts a part corresponding to the element designated in advance from the label value subsequence extracted by the label value subsequence extracting means 31, and supplies the extracted part to the label value pair extracting means. The label value pair extraction unit 34 detects the label value subsequence from the element designation extraction unit 71 and the first value detected by the high frequency label value detection unit 32.
High-frequency label value, the transmission time constraint satisfaction point extracted by the point extraction means 33 and the point-to-point medium transmission time,
In addition, based on the set L (1) of frequent label values held in the frequent label value set management unit 13, the element designation extraction unit 71 out of the label values related to the transmission time constraint satisfaction point.
From the first time point of the label value subsequence from the reference point, the label value that is the label value after the point-to-point medium transmission time corresponding to the point and is an element of L (1) is replaced by the second high-frequency label value Generating a first high-frequency label value and a second high-frequency label value, and a high-frequency label value set candidate having a length of 2 based on both points and a time difference between the two; 11, the appearance frequency of the high-frequency label value set candidate is updated.

【0135】例えばラベル値部分系列抽出手段31が図
18に示すラベル値部分系列を抽出した場合、要素指定
抽出手段71は、要素bに関する部分を抽出するように
予め指定されていると、ラベル値部分系列のうち、図1
9に示すように要素bに関する部分のみを抽出する。図
19に示すラベル値部分系列がラベル値対抽出手段34
に供給されると、生成される高頻度ラベル値組候補は、
常に要素bに関するラベル値が時間的に後側にあるもの
になる。
For example, when the label value subsequence extracting means 31 extracts the label value subsequence shown in FIG. 18, if the element designation extracting means 71 has been designated in advance to extract the part relating to the element b, Figure 1 of the subsequence
As shown in FIG. 9, only the part related to the element b is extracted. The label value subsequence shown in FIG.
, The generated frequent label value set candidate is
The label value for element b is always one that is later in time.

【0136】したがってL(2)の要素も同様に要素b
に関するラベル値が後になる。さらに、ラベル値組生成
手段14はL(2)の要素を組み合わせてL(3)の要
素を生成するので、L(3)の要素である高頻度ラベル
値組においても、時間的に最後のラベル値はすべて要素
bに関するものになる。以下同様にして、全ての高頻度
ラベル値組において、時間的に最後のラベル値が要素b
に関するものになる。さらに、これらの高頻度ラベル値
組からルール抽出手段15によりルールが抽出されるの
で、ルールの結論部のラベル値が要素bに関するものに
なる。
Therefore, the element of L (2) is similarly
The label value for comes later. Further, since the label value set generating means 14 generates the element of L (3) by combining the elements of L (2), even in the high-frequency label value set which is the element of L (3), the last in time. All label values are for element b. Similarly, in all high-frequency label value sets, the temporally last label value
Will be about. Further, rules are extracted by the rule extracting unit 15 from these high-frequency label value sets, so that the label value of the conclusion part of the rule is related to the element b.

【0137】なお、その他の動作については実施の形態
1によるものと同様であるのでその説明を省略する。
Note that the other operations are the same as those in the first embodiment, and a description thereof will be omitted.

【0138】以上のように、この実施の形態5によれ
ば、指定された要素に関する部分のみを抽出したラベル
値部分系列から第2の高頻度ラベル値を検出して長さ2
の高頻度ラベル値組候補を生成するようにしたので、指
定された要素のラベル値が時間的に最後のラベル値とな
る高頻度ラベル値組のみを抽出することができ、結論部
が指定された要素に関するラベル値であるルールのみを
抽出することができるという効果が得られる。また、こ
のように高頻度ラベル値組の形式が制限されるので、結
果的に処理時間が短縮されるという効果が得られる。
As described above, according to the fifth embodiment, the second high-frequency label value is detected from the label value subsequence in which only the portion relating to the specified element is extracted, and the length of the second high-frequency label value is determined.
Since the frequent label value set candidate is generated, only the frequent label value set in which the label value of the specified element is the last label value in time can be extracted, and the conclusion part is specified. This has the effect of extracting only the rule that is the label value for the element that has been set. In addition, since the format of the high-frequency label value set is restricted as described above, the effect that the processing time is consequently reduced is obtained.

【0139】実施の形態6.図20はこの発明の実施の
形態6によるデータマイニング装置の構成を示すブロッ
ク図である。図において、81はユーザによる操作に対
応して2つの地点から構成される1つまたは複数の無相
関地点対を指定する無相関地点対指定手段である。な
お、図20におけるその他の構成要素については実施の
形態1によるものと同様であるので、その説明を省略す
る。
Embodiment 6 FIG. FIG. 20 is a block diagram showing a configuration of a data mining device according to Embodiment 6 of the present invention. In the figure, reference numeral 81 denotes a non-correlated point pair specifying means for specifying one or a plurality of non-correlated point pairs composed of two points in response to a user operation. The other components in FIG. 20 are the same as those according to the first embodiment, and a description thereof will not be repeated.

【0140】次に動作について説明する。無相関地点対
指定手段81は、ユーザにより2つの地点から構成され
る1つまたは複数の無相関地点対が指定されると、その
無相関地点対を地点抽出手段33に供給する。なお、無
相関地点対とは、それらの地点間で影響が伝達すること
がないと予めわかっている地点対のことである。
Next, the operation will be described. When one or a plurality of uncorrelated point pairs composed of two points are specified by the user, the uncorrelated point pair specifying means 81 supplies the uncorrelated point pairs to the point extracting means 33. An uncorrelated pair of points is a pair of points that are known in advance not to transmit an influence between those points.

【0141】地点抽出手段33は、その無相関地点対の
うち第1の高頻度ラベル値の出現地点を含むものを検出
し、無相関地点対のうち第1の高頻度ラベル値の出現地
点でない地点を伝達時間制約満足地点から削除し、残り
の伝達時間制約満足地点およびその地点間媒体伝達時間
をラベル値対抽出手段34に供給する。
The point extracting means 33 detects a point including the appearance point of the first high-frequency label value among the uncorrelated point pairs, and detects the point which is not the appearance point of the first high-frequency label value among the uncorrelated point pairs. The points are deleted from the transmission time constraint satisfaction points, and the remaining transmission time constraint satisfaction points and the inter-point medium transmission time are supplied to the label value pair extraction means 34.

【0142】なお、その他の動作については実施の形態
1によるものと同様であるのでその説明を省略する。
Note that the other operations are the same as those in the first embodiment, and a description thereof will be omitted.

【0143】以上のように、この実施の形態6によれ
ば、予め影響が伝達することはないと判明している無相
関地点対がある場合、その無相関地点対の一方の地点に
対する伝達時間制約満足地点として無相関地点対の他方
の地点を抽出しないようにするので、影響が伝達するこ
とがない無相関地点対に関する意味のない高頻度ラベル
値組が生成されないという効果が得られる。また、この
ように高頻度ラベル値組の形式が制限され、処理時間が
短縮されるという効果が得られる。
As described above, according to the sixth embodiment, when there is a pair of uncorrelated points whose influence is known not to be transmitted in advance, the transmission time to one point of the pair of uncorrelated points is determined. Since the other point of the uncorrelated point pair is not extracted as the constraint satisfaction point, there is an effect that an insignificant high-frequency label value set regarding the uncorrelated point pair whose influence is not transmitted is not generated. In addition, the format of the high-frequency label value set is restricted as described above, and the effect that the processing time is shortened is obtained.

【0144】なお、上記実施の形態1〜6については、
上述の処理をコンピュータに実行させるためのプログラ
ムを記録したコンピュータ読み取り可能な記録媒体と、
コンピュータとによっても実現することができる。その
場合、コンピュータにおけるバスを介してCPUに接続
されたRAMやハードディスク装置などが上述の各保持
手段として機能し、CPUがその他の手段として機能
し、バスを介して各種データが授受される。
In the first to sixth embodiments,
A computer-readable recording medium recording a program for causing a computer to execute the above-described processing,
It can also be realized by a computer. In this case, a RAM or a hard disk device connected to the CPU via a bus in the computer functions as each of the above-described holding units, the CPU functions as other units, and various types of data are exchanged via the bus.

【0145】[0145]

【発明の効果】以上のように、この発明によれば、媒体
が空間内を移動する速度である媒体伝達速度の範囲とそ
の各範囲を代表する代表媒体伝達速度との対応関係に基
づいて、媒体伝達速度の時系列である媒体伝達速度系列
を構成する各媒体伝達速度を代表媒体伝達速度に変換し
て代表媒体伝達速度系列を生成する媒体速度分類手段
と、各地点の空間的情報および代表媒体伝達速度に基づ
いて、各地点対の2地点を第1の地点および第2の地点
として、第1の地点から第2の地点へ媒体が移動する時
間および第2の地点から第1の地点へ媒体が移動する時
間をそれぞれ地点間媒体伝達時間として計算する計算手
段と、高頻度ラベル値組候補を構成するラベル値のうち
の時間的に最後のラベル値と残りのラベル値のうちの1
つとで構成される2ラベル値組の時間的に前側のラベル
値を前側ラベル値とし時間的に後側のラベル値を後側ラ
ベル値として、すべての前側ラベル値に関して、前側ラ
ベル値の出現時点と後側ラベル値の出現時点との時間差
が前側ラベル値の出現時点での前側ラベル値の出現地点
から後側ラベル値の出現地点への地点間媒体伝達時間以
上であるという制約条件を満たすか否かを判定するラベ
ル値間制約判定手段と、媒体に依存する1つまたは複数
の要素に関するラベル値の時系列であるラベル値系列で
の各高頻度ラベル値候補の出現頻度をカウントし、ラベ
ル値間制約判定手段により制約条件を満たすと判定され
た場合にのみラベル値系列での各高頻度ラベル値組候補
の出現頻度をカウントするラベル値組検証手段と、出現
頻度が所定の下限値以上である高頻度ラベル値候補また
は高頻度ラベル値組候補をそれぞれ高頻度ラベル値また
は高頻度ラベル値組とする高頻度ラベル値組抽出手段
と、2つの高頻度ラベル値を第1のラベル値および第2
のラベル値として組み合わせたラベル値組のうち、第1
のラベル値の出現時点と第2のラベル値の出現時点との
時間差が第1のラベル値の出現時点での第1のラベル値
の出現地点と第2のラベル値の出現地点との間の地点間
媒体伝達時間以上でありかつ所定の最大伝達時間以下で
あり、さらにラベル値系列に出現するものを高頻度ラベ
ル値組候補とするラベル値対生成手段と、複数の異なる
高頻度ラベル値組を組み合わせて新たな高頻度ラベル値
組候補を生成する高頻度ラベル値組候補生成手段とを備
えるようにしたので、地点間の媒体伝達時間による制約
のために依存関係がないと判断されるルールを除いて時
間的な相関ルールを抽出することができるという効果が
ある。すなわち、地点間の媒体伝達時間による制約のた
めに依存関係がない無意味なパターンが生成されないと
いう効果がある。また、無意味なパターンが生成されな
いので、ルール抽出のための処理時間を短縮することが
できるという効果がある。
As described above, according to the present invention, based on the correspondence between the range of the medium transmission speed, which is the speed at which the medium moves in the space, and the representative medium transmission speed representing each range, Medium speed classification means for converting each medium transmission speed constituting a medium transmission speed sequence which is a time series of medium transmission speeds into a representative medium transmission speed to generate a representative medium transmission speed sequence, and spatial information and representatives of each point Based on the medium transmission speed, the time at which the medium moves from the first point to the second point and the first point from the second point, with the two points of each point pair as a first point and a second point. Calculating means for calculating the time required for the medium to move to the medium as the point-to-point medium transmission time, and one of the temporally last label value and the remaining label value among the label values constituting the high frequency label value set candidate
The label value on the front side in time of the two label value set composed of the first and second label values is regarded as the front label value, and the label value on the rear side in time is regarded as the rear label value. Whether the time difference between the current label value and the current time of the rear label value is equal to or greater than the point-to-point medium transmission time from the current position of the previous label value to the current position of the rear label value at the current time of the previous label value Label-value constraint determining means for determining whether or not each of the high-frequency label value candidates appears in a label value series which is a time series of label values relating to one or more elements depending on a medium; A label value set verifying means for counting the frequency of occurrence of each high-frequency label value set candidate in the label value series only when the inter-value constraint determining means determines that the constraint condition is satisfied; A high-frequency label value set extracting means for setting the high-frequency label value candidates or the high-frequency label value set candidates as the high-frequency label values or the high-frequency label value sets, respectively, and the two high-frequency label values as the first label values And the second
Of the label value pairs combined as the label value of
The time difference between the present time of the label value and the present time of the second label value is the time difference between the appearance point of the first label value and the appearance point of the second label value at the present time of the first label value. A label value pair generating means that is longer than the point-to-point medium transmission time and shorter than a predetermined maximum transmission time, and that appears in the label value sequence as a high-frequency label value set candidate; and a plurality of different high-frequency label value sets. And a high-frequency label value set candidate generating means for generating a new high-frequency label value set candidate by combining the rules. There is an effect that temporal association rules can be extracted except for. That is, there is an effect that a meaningless pattern having no dependency is not generated due to the restriction due to the medium transmission time between points. Further, since a meaningless pattern is not generated, there is an effect that processing time for rule extraction can be reduced.

【0146】この発明によれば、高頻度ラベル値組を構
成するラベル値のうち時間的に最後のラベル値を結論部
とし残りのラベル値を条件部とするルール候補のうち、
ラベル値系列での条件部の出現頻度とその高頻度ラベル
値組の出現頻度との比が所定の範囲にあるものをルール
として抽出するルール抽出手段を備えるように構成した
ので、地点間の伝達時間による制約のために依存関係が
ないと判断されるルールを除いて時間的な相関ルールを
抽出することができるという効果がある。
According to the present invention, of the rule candidates in which the temporally last label value among the label values constituting the frequent label value set is the conclusion part and the remaining label values are the condition parts,
A rule extracting means for extracting, as a rule, a rule in which the ratio between the appearance frequency of the condition part in the label value series and the appearance frequency of the high-frequency label value set is within a predetermined range is provided, so that transmission between points is performed. There is an effect that a temporal correlation rule can be extracted except for a rule determined to have no dependency due to time constraints.

【0147】この発明によれば、地点の空間的情報に基
づいて第1の地点と第2の地点との間の距離を地点間距
離として計算する距離算出手段と、第1の地点を起点と
して第2の地点を通る半直線と代表媒体伝達速度の向き
とのなす角度を角度差として計算する角度差算出手段
と、距離算出手段により計算された地点間距離、代表媒
体伝達速度、および角度差算出手段により計算された角
度差に基づいて地点間媒体伝達時間を計算する媒体伝達
時間算出手段とを計算手段に有するように構成したの
で、媒体の移動を考慮した適切な地点間媒体伝達時間を
計算することができるという効果がある。
According to the present invention, the distance calculating means for calculating the distance between the first point and the second point as the point-to-point distance based on the spatial information of the point, and the first point as the starting point Angle difference calculating means for calculating, as an angle difference, an angle between a half line passing through the second point and the direction of the representative medium transmission speed, and a point-to-point distance, representative medium transmission speed, and angle difference calculated by the distance calculating means The medium transmission time calculation means for calculating the point-to-point medium transmission time based on the angle difference calculated by the calculation means is configured to have in the calculation means, so that an appropriate point-to-point medium transmission time taking into account the movement of the medium is calculated. This has the effect of being able to calculate.

【0148】この発明によれば、距離算出手段により、
空間的情報としての各地点の緯度と経度から地点間の距
離を計算するように構成したので、媒体の高度方向への
伝達に要する時間を無視できる際には適切な地点間媒体
伝達時間を得ることができるという効果がある。
According to the present invention, the distance calculating means
Since the distance between points is calculated from the latitude and longitude of each point as spatial information, if the time required for transmitting the medium in the altitude direction can be ignored, an appropriate point-to-point medium transmission time is obtained. There is an effect that can be.

【0149】この発明によれば、距離算出手段により、
空間的情報としての各地点の緯度、経度および高度から
地点間の距離を計算するように構成したので、媒体の高
度方向への伝達に要する時間を無視できなくても適切な
地点間媒体伝達時間を得ることができるという効果があ
る。
According to the present invention, the distance calculating means
Since the distance between points is calculated from the latitude, longitude and altitude of each point as spatial information, it is appropriate to transmit the medium between points even if the time required to transmit the medium in the height direction cannot be ignored. Is obtained.

【0150】この発明によれば、角度差算出手段により
計算された角度差が所定の範囲内に存在するか否かに応
じて第1の地点から第2の地点へ媒体が移動するか否
か、および第2の地点から第1の地点へ媒体が移動する
か否かを判定する角度差判定手段と、第1の地点から第
2の地点へ媒体が移動すると判定された場合には距離算
出手段により計算された地点間距離と代表媒体伝達速度
との比を第1の地点から第2の地点への地点間媒体伝達
時間として計算し、第1の地点から第2の地点へ媒体が
移動しないと判定された場合には第1の地点から第2の
地点への地点間媒体伝達時間を所定の大きな値とし、第
2の地点から第1の地点へ媒体が移動すると判定された
場合には地点間距離と代表媒体伝達速度との比を第2の
地点から第1の地点への地点間媒体伝達時間として計算
し、第2の地点から第1の地点へ媒体が移動しないと判
定された場合には第2の地点から第1の地点への地点間
媒体伝達時間を所定の大きな値とする距離対媒体速度比
算出手段とを媒体伝達時間算出手段に有するように構成
したので、地点間媒体伝達時間を簡単にかつ適切に計算
することができるという効果がある。
According to the present invention, whether or not the medium moves from the first point to the second point according to whether or not the angle difference calculated by the angle difference calculation means is within a predetermined range. And an angle difference determining means for determining whether or not the medium moves from the second point to the first point, and calculating a distance when it is determined that the medium moves from the first point to the second point Calculating the ratio of the point-to-point distance calculated by the means to the representative medium transmission speed as the point-to-point medium transmission time from the first point to the second point, and moving the medium from the first point to the second point. If it is determined that the medium is not to be transmitted, the point-to-point medium transmission time from the first point to the second point is set to a predetermined large value, and if it is determined that the medium moves from the second point to the first point, Is the ratio of the distance between the points and the representative medium transmission speed from the second point to the first point Is calculated as the point-to-point medium transmission time, and when it is determined that the medium does not move from the second point to the first point, the point-to-point medium transmission time from the second point to the first point is calculated as a predetermined time. Since the medium transmission time calculating means is provided with the distance-to-medium speed ratio calculating means having a large value, there is an effect that the point-to-point medium transmitting time can be easily and appropriately calculated.

【0151】この発明によれば、代表媒体伝達速度の、
第1の地点と第2の地点を結ぶ直線の方向の成分を距離
方向速度として計算する距離方向速度算出手段と、第1
の地点を起点として第2の地点を通る半直線と距離方向
速度の向きとが一致している場合には地点間距離と距離
方向速度の大きさとの比を第1の地点から第2の地点へ
の地点間媒体伝達時間として計算し、半直線と距離方向
速度の向きとが一致していない場合には第1の地点から
第2の地点への地点間媒体伝達時間を所定の大きな値と
し、第2の地点を起点として第1の地点を通る半直線と
距離方向速度の向きとが一致している場合には地点間距
離と距離方向速度の大きさとの比を第2の地点から第1
の地点への地点間媒体伝達時間として計算し、半直線と
距離方向速度の向きとが一致していない場合には第2の
地点から第1の地点への地点間媒体伝達時間を所定の大
きな値とする距離対媒体速度比算出手段とを媒体伝達時
間算出手段に有するように構成したので、地点間媒体伝
達時間をより適切に計算することができるという効果が
ある。
According to the present invention, the representative medium transmission speed is
A distance direction speed calculating means for calculating a component in a direction of a straight line connecting the first point and the second point as a distance direction speed;
If the direction of the speed in the distance direction matches the direction of the half-line passing through the second point starting from the point of the second point, the ratio of the distance between the points and the magnitude of the distance direction speed is determined from the first point to the second point. Is calculated as the point-to-point medium transmission time, and when the direction of the half-line and the distance direction velocity do not match, the point-to-point medium transmission time from the first point to the second point is set to a predetermined large value. When the direction of the semi-straight line passing through the first point and the direction of the distance direction from the second point coincide, the ratio of the distance between the points and the magnitude of the distance direction speed is calculated from the second point to the second point. 1
Is calculated as the point-to-point medium transmission time to the point, and when the direction of the half-line and the distance direction velocity do not match, the point-to-point medium transmission time from the second point to the first point is set to a predetermined large value. Since the distance-to-medium speed ratio calculating means having the value is provided in the medium transmission time calculating means, there is an effect that the point-to-point medium transmission time can be more appropriately calculated.

【0152】この発明によれば、媒体伝達速度系列が各
地点毎に得られている場合に、各地点対の2地点にそれ
ぞれ対応する2つの媒体伝達速度系列から地点間代表速
度系列を計算する地点間代表速度系列算出手段を備え、
媒体速度分類手段が媒体伝達速度系列の代わりに地点間
代表速度系列を使用するように構成したので、地点間媒
体伝達時間をより適切に計算することができるという効
果がある。
According to the present invention, when a medium transmission speed sequence is obtained for each point, an inter-point representative speed sequence is calculated from two medium transmission speed sequences respectively corresponding to two points of each point pair. A point-to-point representative speed series calculating means,
Since the medium speed classification means is configured to use the point-to-point representative speed sequence instead of the medium transmission speed sequence, there is an effect that the point-to-point medium transmission time can be more appropriately calculated.

【0153】この発明によれば、媒体伝達速度系列を構
成する各時点における媒体伝達速度を、その媒体伝達速
度およびその近傍の1つまたは複数の時点における媒体
伝達速度の平均に変換して媒体伝達速度系列を平滑化媒
体伝達速度系列に変換する媒体速度系列平滑化手段を備
え、媒体速度分類手段が媒体伝達速度系列の代わりに媒
体速度系列平滑化手段により変換された平滑化媒体伝達
速度系列を使用するように構成したので、その複数の媒
体伝達速度の性質を組み込んだ平滑化後の媒体伝達速度
でラベル値間の制約条件の判定がされ、より適切な判定
を実行することができるという効果がある。
According to the present invention, the medium transmission speed at each point in the medium transmission speed sequence is converted into an average of the medium transmission speed and the medium transmission speed at one or more time points near the medium transmission speed. Medium speed series smoothing means for converting the speed series into a smoothed medium transmission speed series, wherein the medium speed classification means converts the smoothed medium transmission speed series converted by the medium speed series smoothing means instead of the medium transmission speed series. Since it is configured to use, the constraint condition between the label values is determined based on the smoothed medium transmission speed incorporating the properties of the plurality of medium transmission speeds, and more appropriate determination can be performed. There is.

【0154】この発明によれば、ラベル値系列のうち所
定の時間幅に含まれる部分系列をラベル値部分系列とし
て抽出するラベル値部分系列抽出手段と、ラベル値部分
系列の最初の時点におけるラベル値が高頻度ラベル値で
ある場合にそのラベル値を第1の高頻度ラベル値とする
高頻度ラベル値検出手段と、第1の高頻度ラベル値の出
現時点での、第1の高頻度ラベル値の出現地点を起点と
した場合の地点間媒体伝達時間が所定の最大伝達時間以
下である地点を伝達時間制約満足地点として抽出する地
点抽出手段と、ラベル値部分系列における伝達時間制約
満足地点に関するラベル値のうち、ラベル値部分系列の
最初の時点からその地点に対応する地点間媒体伝達時間
以降のラベル値であり、かつ高頻度ラベル値であるラベ
ル値を第2の高頻度ラベル値とし、第1の高頻度ラベル
値および第2の高頻度ラベル値で高頻度ラベル値組候補
を生成するラベル値対抽出手段とをラベル値対生成手段
に有するように構成したので、媒体伝達時間に関する制
約を満たした長さ2の高頻度ラベル値組候補を簡単に生
成することができるという効果がある。
According to the present invention, a label value subsequence extracting means for extracting a subsequence included in a predetermined time width from a label value sequence as a label value subsequence, and a label value at the first time of the label value subsequence Is a high-frequency label value, the label value is a first high-frequency label value, a high-frequency label value detecting means, and the first high-frequency label value at the time when the first high-frequency label value is output Point extraction means for extracting, as a transmission time constraint satisfaction point, a point where the point-to-point medium transmission time is less than or equal to a predetermined maximum transmission time when the appearance point of the symbol is a starting point, and a label related to the transmission time constraint satisfaction point in the label value subsequence Of the values, the label value that is the label value from the initial point of the label value subsequence to the point-to-point medium transmission time corresponding to that point and that is the frequent label value is the second high frequency value. Since the label value pair generating means has label value pair and label value pair extracting means for generating a high frequency label value set candidate with the first high frequency label value and the second high frequency label value, the medium There is an effect that a high-frequency label value set candidate having a length of 2 that satisfies the constraint on the transmission time can be easily generated.

【0155】この発明によれば、ラベル値部分系列抽出
手段によるラベル値部分系列から予め指定された要素に
対応するものを抽出する要素指定抽出手段をラベル値対
生成手段に有し、ラベル値対抽出手段がラベル値部分系
列抽出手段によるラベル値部分系列の代わりに要素指定
抽出手段により抽出された系列を使用するように構成し
たので、指定された要素のラベル値が時間的に最後のラ
ベル値となる高頻度ラベル値組のみを抽出することがで
き、結論部が指定された要素に関するラベル値であるル
ールのみを抽出することができるという効果がある。ま
た、このように高頻度ラベル値組の形式が制限されるの
で、結果的に処理時間が短縮されるという効果がある。
According to the present invention, the label value pair generating means has an element designation extracting means for extracting, from the label value subsequence by the label value subsequence extracting means, the one corresponding to the element designated in advance. Since the extracting means is configured to use the series extracted by the element specification extracting means instead of the label value subsequence by the label value subsequence extracting means, the label value of the specified element is temporally the last label value. It is possible to extract only the high-frequency label-value group that satisfies the following condition, and it is possible to extract only the rule whose label is the label value of the element whose conclusion is specified. In addition, since the format of the high-frequency label value set is restricted as described above, there is an effect that the processing time is consequently reduced.

【0156】この発明によれば、地点抽出手段が所定の
無相関地点対のうち第1の高頻度ラベル値の出現地点を
含むものを検出し、無相関地点対のうちの第1の高頻度
ラベル値の出現地点でない地点を伝達時間制約満足地点
から削除するように構成したので、影響が伝達すること
がない無相関地点対に関する意味のない高頻度ラベル値
組が生成されないという効果がある。また、このように
高頻度ラベル値組の形式が制限され、処理時間が短縮さ
れるという効果がある。
According to the present invention, the point extracting means detects a point including an appearance point of the first high-frequency label value among the predetermined uncorrelated point pairs, and detects the first high-frequency label among the uncorrelated point pairs. Since the point which is not the point where the label value appears is deleted from the point of satisfaction of the transmission time constraint, there is an effect that an insignificant high-frequency label value set regarding the uncorrelated point pair whose influence is not transmitted is not generated. In addition, the format of the high-frequency label value set is restricted as described above, and the processing time is shortened.

【0157】この発明によれば、媒体が空間内を移動す
る速度である媒体伝達速度の範囲とその各範囲を代表す
る代表媒体伝達速度との対応関係に基づいて、媒体伝達
速度の時系列である媒体伝達速度系列を構成する各媒体
伝達速度を代表媒体伝達速度に変換して代表媒体伝達速
度系列を生成するステップと、2つの地点の空間的情報
および各代表媒体伝達速度に基づいて、2つの地点を第
1の地点および第2の地点として、第1の地点から第2
の地点へ媒体が移動する時間および第2の地点から第1
の地点へ媒体が移動する時間をそれぞれ地点間媒体伝達
時間として計算するステップと、媒体に依存する1つま
たは複数の要素に関するラベル値の時系列であるラベル
値系列での各高頻度ラベル値候補の出現頻度をカウント
するステップと、出現頻度が所定の下限値以上である高
頻度ラベル値候補を高頻度ラベル値とするステップと、
2つの高頻度ラベル値を第1のラベル値および第2のラ
ベル値として組み合わせたラベル値組のうち、第1のラ
ベル値の出現時点と第2のラベル値の出現時点との時間
差が第1のラベル値の出現時点での第1のラベル値の出
現地点と第2のラベル値の出現地点との間の地点間媒体
伝達時間以上でありかつ所定の最大伝達時間以下であ
り、さらにラベル値系列に出現するものを高頻度ラベル
値組候補とするステップと、高頻度ラベル値組候補を構
成するラベル値のうちの時間的に最後のラベル値と残り
のラベル値のうちの1つとで構成される2ラベル値組の
時間的に前側のラベル値を前側ラベル値とし時間的に後
側のラベル値を後側ラベル値として、すべての前側ラベ
ル値に関して、前側ラベル値の出現時点と後側ラベル値
の出現時点との時間差が前側ラベル値の出現時点での前
側ラベル値の出現時点から後側ラベル値の出現地点への
地点間媒体伝達時間以上であるという制約条件を満たす
か否かを判定するステップと、その制約条件を満たすと
判定された場合にのみラベル値系列での各高頻度ラベル
値組候補の出現頻度をカウントするステップと、出現頻
度が所定の下限値以上である高頻度ラベル値組候補を高
頻度ラベル値組とするステップと、複数の異なる高頻度
ラベル値組を組み合わせて新たな高頻度ラベル値組候補
を生成するステップとを備えるようにしたので、地点間
の媒体伝達時間による制約のために依存関係がないと判
断されるルールを除いて時間的な相関ルールを抽出する
ことができるという効果がある。すなわち、地点間の媒
体伝達時間による制約のために依存関係がない無意味な
パターンが生成されないという効果がある。また、無意
味なパターンが生成されないので、ルール抽出のための
処理時間を短縮することができるという効果がある。
According to the present invention, based on the correspondence between the range of the medium transmission speed, which is the speed at which the medium moves in the space, and the representative medium transmission speed representing each of the ranges, the medium transmission speed is time-series. Converting each medium transmission speed constituting a certain medium transmission speed sequence into a representative medium transmission speed to generate a representative medium transmission speed sequence; and 2 based on spatial information of two points and each representative medium transmission speed. Two points from the first point to the second point as the first point and the second point.
Time for the medium to move to the point and the first time from the second point
Calculating the time required for the medium to move to a point as a medium-to-point medium transmission time; and each high-frequency label value candidate in a label value series that is a time series of label values for one or more elements depending on the medium. Counting the frequency of appearance, and the step of setting a high frequency label value candidate whose frequency of appearance is equal to or higher than a predetermined lower limit value as a high frequency label value,
Among the label value sets in which two high-frequency label values are combined as a first label value and a second label value, the time difference between the present time of the first label value and the present time of the second label value is the first. Is greater than or equal to the point-to-point medium transmission time between the point of appearance of the first label value and the point of appearance of the second label value at the present time, and less than or equal to a predetermined maximum transmission time, and the label value Making the one appearing in the series a frequent label value set candidate, and comprising a temporally last label value and one of the remaining label values among the label values constituting the frequent label value set candidate The label value on the temporally front side of the two label value set to be used is the front label value, and the label value on the temporal side is the rear label value. Time relative to the present time of the label value And determining whether or not the condition is equal to or longer than the point-to-point medium transmission time from the present time of the front label value to the appearance point of the rear label value at the present time of the front label value, and the constraint condition Counting the frequency of appearance of each high-frequency label value set candidate in the label value series only when it is determined that the above is satisfied. A value set and a step of generating a new high-frequency label value set candidate by combining a plurality of different high-frequency label value sets. There is an effect that a temporal correlation rule can be extracted except for a rule determined to be unrelated. That is, there is an effect that a meaningless pattern having no dependency is not generated due to the restriction due to the medium transmission time between points. Further, since a meaningless pattern is not generated, there is an effect that processing time for rule extraction can be reduced.

【0158】この発明によれば、媒体が空間内を移動す
る速度である媒体伝達速度の範囲とその各範囲を代表す
る代表媒体伝達速度との対応関係に基づいて、媒体伝達
速度の時系列である媒体伝達速度系列を構成する各媒体
伝達速度を代表媒体伝達速度に変換して代表媒体伝達速
度系列を生成する媒体速度分類手段、各地点の空間的情
報および代表媒体伝達速度に基づいて、各地点対の2地
点を第1の地点および第2の地点として第1の地点から
第2の地点へ媒体が移動する時間および第2の地点から
第1の地点へ媒体が移動する時間をそれぞれ地点間媒体
伝達時間として計算する計算手段、高頻度ラベル値組候
補を構成するラベル値のうちの時間的に最後のラベル値
と残りのラベル値のうちの1つとで構成される2ラベル
値組の時間的に前側のラベル値を前側ラベル値とし時間
的に後側のラベル値を後側ラベル値として、すべての前
側ラベル値に関して、前側ラベル値の出現時点と後側ラ
ベル値の出現時点との時間差が前側ラベル値の出現時点
での前側ラベル値の出現地点から後側ラベル値の出現地
点への地点間媒体伝達時間以上であるという制約条件を
満たすか否かを判定するラベル値間制約判定手段、媒体
に依存する1つまたは複数の要素に関するラベル値の時
系列であるラベル値系列での各高頻度ラベル値候補の出
現頻度をカウントし、ラベル値間制約判定手段により制
約条件を満たすと判定された場合にのみラベル値系列で
の各高頻度ラベル値組候補の出現頻度をカウントするラ
ベル値組検証手段、出現頻度が所定の下限値以上である
高頻度ラベル値候補または高頻度ラベル値組候補をそれ
ぞれ高頻度ラベル値または高頻度ラベル値組とする高頻
度ラベル値組抽出手段、2つの高頻度ラベル値を第1の
ラベル値および第2のラベル値として組み合わせたラベ
ル値組のうち、第1のラベル値の出現時点と第2のラベ
ル値の出現時点との時間差が第1のラベル値の出現時点
での第1のラベル値の出現地点と第2のラベル値の出現
地点との間の地点間媒体伝達時間以上でありかつ所定の
最大伝達時間以下であり、さらにラベル値系列に出現す
るものを高頻度ラベル値組候補とするラベル値対生成手
段、並びに、複数の異なる高頻度ラベル値組を組み合わ
せて新たな高頻度ラベル値組候補を生成する高頻度ラベ
ル値組候補生成手段としてコンピュータを機能させるた
めのプログラムを記録媒体に記録したので、コンピュー
タによりそのプログラムを実行した場合に、地点間の媒
体伝達時間による制約のために依存関係がないと判断さ
れるルールを除いて時間的な相関ルールを抽出すること
ができるという効果がある。すなわち、地点間の媒体伝
達時間による制約のために依存関係がない無意味なパタ
ーンが生成されないという効果がある。また、無意味な
パターンが生成されないので、ルール抽出のための処理
時間を短縮することができるという効果がある。
According to the present invention, based on the correspondence between the range of the medium transmission speed, which is the speed at which the medium moves in the space, and the representative medium transmission speed representing each of the ranges, the medium transmission speed is represented in time series. Medium speed classification means for converting each medium transmission speed constituting a certain medium transmission speed sequence into a representative medium transmission speed sequence to generate a representative medium transmission speed sequence, based on spatial information at each point and the representative medium transmission speed, The time at which the medium moves from the first point to the second point and the time at which the medium moves from the second point to the first point are defined as the two points of the point pair as the first point and the second point, respectively. Calculating means for calculating the inter-medium transmission time, a two-label value set composed of a temporally last label value of label values constituting one of the high-frequency label value set candidates and one of the remaining label values In time ago For all front label values, the time difference between the current time of the front label value and the current time of the rear label value is the front label for all front label values. The label value constraint determining means for determining whether or not the constraint that the medium transmission time from the point of appearance of the front label value at the present point of time to the point of appearance of the rear label value is longer than the point-to-point medium transmission time is satisfied. Count the appearance frequency of each high-frequency label value candidate in a label value series that is a time series of label values for one or more dependent elements, and when it is determined by the label value constraint determination unit that the constraint condition is satisfied. Label value set verification means for counting the appearance frequency of each high-frequency label value set candidate in the label value series only, a high-frequency label value candidate or a high-frequency label whose appearance frequency is equal to or higher than a predetermined lower limit. Label value set extracting means, each of which sets the value set candidate as a high-frequency label value or a high-frequency label value set, and a label value set in which two high-frequency label values are combined as a first label value and a second label value The time difference between the present time of the first label value and the present time of the second label value is the appearance point of the first label value and the appearance of the second label value at the present time of the first label value A label value pair generation unit that is longer than the point-to-point medium transmission time between the points and is shorter than a predetermined maximum transmission time, and furthermore, a label value series that appears in a label value series as a high-frequency label value set candidate; and Since a program for causing a computer to function as a high-frequency label value set candidate generating means for generating a new high-frequency label value set candidate by combining different high-frequency label value sets is recorded on a recording medium, When the program is executed by a computer, there is an effect that a temporal correlation rule can be extracted except for a rule that is determined to have no dependency due to a restriction due to a medium transmission time between points. That is, there is an effect that a meaningless pattern having no dependency is not generated due to the restriction due to the medium transmission time between points. Further, since a meaningless pattern is not generated, there is an effect that processing time for rule extraction can be reduced.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 この発明の実施の形態1によるデータマイニ
ング装置の構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a data mining device according to Embodiment 1 of the present invention.

【図2】 地点A,B,Cの一例を示す図である。FIG. 2 is a diagram showing an example of points A, B, and C.

【図3】 媒体伝達速度系列の一例を示す図である。FIG. 3 is a diagram illustrating an example of a medium transmission speed sequence.

【図4】 地点A,B,Cにおいて得られたラベル値系
列の一例を示す図である。
FIG. 4 is a diagram showing an example of a label value sequence obtained at points A, B, and C.

【図5】 媒体伝達速度の各範囲と代表媒体伝達速度と
の対応関係の一例を示す図である。
FIG. 5 is a diagram illustrating an example of a correspondence relationship between each range of a medium transmission speed and a representative medium transmission speed.

【図6】 代表媒体伝達速度系列の一例を示す図であ
る。
FIG. 6 is a diagram illustrating an example of a representative medium transmission speed sequence.

【図7】 2地点による半直線と代表媒体伝達速度の向
きとのなす角度の例を示す図である。
FIG. 7 is a diagram illustrating an example of an angle between a half line at two points and a direction of a representative medium transmission speed.

【図8】 ラベル値部分系列抽出手段により抽出された
ラベル値部分系列の一例を示す図である。
FIG. 8 is a diagram showing an example of a label value subsequence extracted by a label value subsequence extracting means.

【図9】 この発明の実施の形態2によるデータマイニ
ング装置の構成を示すブロック図である。
FIG. 9 is a block diagram showing a configuration of a data mining device according to a second embodiment of the present invention.

【図10】 代表媒体伝達速度と距離方向速度との対応
関係を示す図である。
FIG. 10 is a diagram showing a correspondence relationship between a representative medium transmission speed and a distance direction speed.

【図11】この発明の実施の形態3によるデータマイニ
ング装置の構成を示すブロック図である。
FIG. 11 is a block diagram showing a configuration of a data mining device according to Embodiment 3 of the present invention.

【図12】 2地点の媒体伝達速度と地点間代表速度と
の対応関係を示す図である。
FIG. 12 is a diagram illustrating a correspondence between a medium transmission speed at two points and a representative speed between points.

【図13】 この発明の実施の形態4によるデータマイ
ニング装置の構成を示すブロック図である。
FIG. 13 is a block diagram showing a configuration of a data mining device according to Embodiment 4 of the present invention.

【図14】 平滑化媒体伝達速度系列の一例を示す図で
ある。
FIG. 14 is a diagram illustrating an example of a smoothing medium transmission speed sequence.

【図15】 図14の平滑化媒体伝達速度系列より生成
された代表媒体伝達速度系列の一例を示す図である。
15 is a diagram showing an example of a representative medium transmission speed sequence generated from the smoothed medium transmission speed sequence of FIG.

【図16】 この発明の実施の形態5によるデータマイ
ニング装置の構成を示すブロック図である。
FIG. 16 is a block diagram showing a configuration of a data mining device according to Embodiment 5 of the present invention.

【図17】 地点A,B,Cにおいて得られたラベル値
系列の他の例を示す図である。
FIG. 17 is a diagram showing another example of a label value sequence obtained at points A, B, and C.

【図18】 ラベル値部分系列抽出手段により抽出され
たラベル値部分系列の一例を示す図である。
FIG. 18 is a diagram showing an example of a label value subsequence extracted by a label value subsequence extracting means.

【図19】 要素指定抽出手段により抽出されたラベル
値部分系列の一例を示す図である。
FIG. 19 is a diagram illustrating an example of a label value subsequence extracted by an element designation extraction unit.

【図20】 この発明の実施の形態6によるデータマイ
ニング装置の構成を示すブロック図である。
FIG. 20 is a block diagram showing a configuration of a data mining device according to Embodiment 6 of the present invention.

【図21】 MSDD法の対象になるデータの一例を示
す図である。
FIG. 21 is a diagram showing an example of data to be subjected to the MSDD method.

【図22】 図21に示すデータからMSDD法により
抽出されるルールの一例を示す図である。
FIG. 22 is a diagram showing an example of a rule extracted from the data shown in FIG. 21 by the MSDD method.

【符号の説明】[Explanation of symbols]

3 計算手段、6 媒体速度分類手段、7 ラベル値間
制約判定手段、9 ラベル値対生成手段、10 ラベル
値組検証手段、12 高頻度ラベル値組抽出手段、14
ラベル値組生成手段(高頻度ラベル値組候補生成手
段)、15 ルール抽出手段、21 角度差算出手段、
22 距離算出手段、23 媒体伝達時間算出手段、2
4 角度差判定手段、25 距離対媒体速度比算出手
段、31 ラベル値部分系列抽出手段、32 高頻度ラ
ベル値検出手段、33 地点抽出手段、34 ラベル値
対抽出手段、41 距離方向速度算出手段、51 地点
間代表速度系列算出手段、61 媒体速度系列平滑化手
段、71 要素指定抽出手段。
3 calculation means, 6 medium speed classification means, 7 label value constraint determination means, 9 label value pair generation means, 10 label value set verification means, 12 high frequency label value set extraction means, 14
Label value set generating means (high-frequency label value set candidate generating means), 15 rule extracting means, 21 angle difference calculating means,
22 distance calculation means, 23 medium transmission time calculation means, 2
4 angle difference determination means, 25 distance to medium speed ratio calculation means, 31 label value partial sequence extraction means, 32 high frequency label value detection means, 33 point extraction means, 34 label value pair extraction means, 41 distance direction velocity calculation means, 51 point-to-point representative speed sequence calculating means, 61 medium speed sequence smoothing means, 71 element designation extracting means.

Claims (14)

【特許請求の範囲】[Claims] 【請求項1】 媒体が空間内を移動する速度である媒体
伝達速度の範囲と前記媒体伝達速度の各範囲を代表する
代表媒体伝達速度との対応関係に基づいて、前記媒体伝
達速度の時系列である媒体伝達速度系列を構成する各媒
体伝達速度を前記代表媒体伝達速度に変換して代表媒体
伝達速度系列を生成する媒体速度分類手段と、 各地点の空間的情報および前記代表媒体伝達速度に基づ
いて、各地点対の2地点を第1の地点および第2の地点
として前記第1の地点から前記第2の地点へ媒体が移動
する時間および前記第2の地点から前記第1の地点へ媒
体が移動する時間をそれぞれ地点間媒体伝達時間として
計算する計算手段と、 高頻度ラベル値組候補を構成するラベル値のうちの時間
的に最後のラベル値と残りのラベル値のうちの1つとで
構成される2ラベル値組の時間的に前側のラベル値を前
側ラベル値とし時間的に後側のラベル値を後側ラベル値
として、すべての前記前側ラベル値に関して、前記前側
ラベル値の出現時点と前記後側ラベル値の出現時点との
時間差が前記前側ラベル値の出現時点での、前記前側ラ
ベル値の出現地点から前記後側ラベル値の出現地点への
地点間媒体伝達時間以上であるという制約条件を満たす
か否かを判定するラベル値間制約判定手段と、 前記媒体に依存する1つまたは複数の要素に関するラベ
ル値の時系列であるラベル値系列での各高頻度ラベル値
候補の出現頻度をカウントし、前記ラベル値間制約判定
手段により前記制約条件を満たすと判定された場合にの
み前記ラベル値系列での各高頻度ラベル値組候補の出現
頻度をカウントするラベル値組検証手段と、 前記出現頻度が所定の下限値以上である高頻度ラベル値
候補または高頻度ラベル値組候補をそれぞれ高頻度ラベ
ル値または高頻度ラベル値組とする高頻度ラベル値組抽
出手段と、 2つの前記高頻度ラベル値を第1のラベル値および第2
のラベル値として組み合わせたラベル値組のうち、前記
第1のラベル値の出現時点と前記第2のラベル値の出現
時点との時間差が前記第1のラベル値の出現時点での前
記第1のラベル値の出現地点と前記第2のラベル値の出
現地点との間の前記地点間媒体伝達時間以上でありかつ
所定の最大伝達時間以下であり、さらに前記ラベル値系
列に出現するものを高頻度ラベル値組候補とするラベル
値対生成手段と、 複数の異なる前記高頻度ラベル値組を組み合わせて新た
な高頻度ラベル値組候補を生成する高頻度ラベル値組候
補生成手段とを備えたデータマイニング装置。
1. A time series of the medium transmission speed based on a correspondence relationship between a range of a medium transmission speed, which is a speed at which a medium moves in a space, and a representative medium transmission speed representing each range of the medium transmission speed. Medium speed classifying means for converting each medium transmission speed constituting the medium transmission speed sequence to be the representative medium transmission speed to generate a representative medium transmission speed sequence; spatial information of each point and the representative medium transmission speed The time at which the medium moves from the first point to the second point with the two points of each point pair as a first point and a second point, and from the second point to the first point Calculating means for calculating the time required for the medium to travel as a medium-to-point medium transmission time; and a temporally last label value and one of the remaining label values among the label values constituting the high-frequency label value set candidate. Composed of The label value on the temporally front side of the two label value set to be used is the front label value, and the label value on the temporal side is the rear label value. Constraint that the time difference from the present time of the rear label value is equal to or longer than the point-to-point medium transmission time from the appearance point of the front label value to the appearance point of the rear label value at the present time of the front label value. A label value constraint determining means for determining whether or not the above-mentioned condition is satisfied; and determining the appearance frequency of each high-frequency label value candidate in a label value series which is a time series of label values relating to one or more elements depending on the medium. A label value set that counts and counts the appearance frequency of each high-frequency label value set candidate in the label value series only when it is determined that the constraint condition is satisfied by the label value constraint determination unit. Verification means, the high frequency label value candidate or high frequency label value set candidate where the appearance frequency is equal to or more than a predetermined lower limit value, and the high frequency label value set high frequency label value set extraction means, The two frequent label values are a first label value and a second label value
The time difference between the present point of time of the first label value and the present point of time of the second label value is the first label value at the present point of time of the first label value. The frequency between the point-to-point medium transmission time between the point of appearance of the label value and the point of appearance of the second label value is longer than or equal to the predetermined maximum transmission time, and appears in the label value series at a high frequency. Data mining comprising: label value pair generation means as label value set candidates; and high frequency label value set candidate generation means for generating a new high frequency label value set candidate by combining a plurality of different high frequency label value sets. apparatus.
【請求項2】 高頻度ラベル値組を構成するラベル値の
うち時間的に最後のラベル値を結論部とし残りのラベル
値を条件部とするルール候補のうち、ラベル値系列での
前記条件部の出現頻度と前記高頻度ラベル値組の出現頻
度との比が所定の範囲にあるものをルールとして抽出す
るルール抽出手段を備えることを特徴とする請求項1記
載のデータマイニング装置。
2. The rule part in a label value series among rule candidates in which a temporally last label value among label values constituting a high-frequency label value set is a conclusion part and the remaining label values are condition parts. 2. The data mining apparatus according to claim 1, further comprising a rule extracting unit that extracts, as a rule, a rule having a ratio between the frequency of occurrence of the high frequency label value set and the frequency of occurrence of the high frequency label value set.
【請求項3】 計算手段は、地点の空間的情報に基づい
て第1の地点と第2の地点との間の距離を地点間距離と
して計算する距離算出手段と、前記第1の地点を起点と
して前記第2の地点を通る半直線と代表媒体伝達速度の
向きとのなす角度を角度差として計算する角度差算出手
段と、前記距離算出手段により計算された前記地点間距
離、前記代表媒体伝達速度、および前記角度差算出手段
により計算された前記角度差に基づいて地点間媒体伝達
時間を計算する媒体伝達時間算出手段とを有することを
特徴とする請求項1記載のデータマイニング装置。
3. A distance calculating means for calculating a distance between a first point and a second point as a point-to-point distance based on spatial information of the point, and starting from the first point. Angle difference calculating means for calculating, as an angle difference, an angle formed between a half line passing through the second point and the direction of the representative medium transmission speed, the distance between the points calculated by the distance calculating means, the representative medium transmission 2. The data mining apparatus according to claim 1, further comprising a medium transmission time calculation unit that calculates a point-to-point medium transmission time based on a speed and the angle difference calculated by the angle difference calculation unit.
【請求項4】 各地点の空間的情報はその地点の緯度と
経度を有し、 距離算出手段は、その緯度と経度から地点間の距離を計
算することを特徴とする請求項3記載のデータマイニン
グ装置。
4. The data according to claim 3, wherein the spatial information of each point includes a latitude and a longitude of the point, and the distance calculating means calculates a distance between the points from the latitude and the longitude. Mining equipment.
【請求項5】 各地点の空間的情報はその地点の緯度、
経度および高度を有し、 距離算出手段は、その緯度、経度および高度から地点間
の距離を計算することを特徴とする請求項3記載のデー
タマイニング装置。
5. The spatial information of each point is the latitude of the point,
4. The data mining apparatus according to claim 3, wherein the data mining apparatus has a longitude and an altitude, and the distance calculating means calculates a distance between the points based on the latitude, the longitude and the altitude.
【請求項6】 媒体伝達時間算出手段は、角度差算出手
段により計算された角度差が所定の範囲内に存在するか
否かに応じて第1の地点から第2の地点へ媒体が移動す
るか否か、および前記第2の地点から前記第1の地点へ
媒体が移動するか否かを判定する角度差判定手段と、前
記第1の地点から前記第2の地点へ媒体が移動すると判
定された場合には前記距離算出手段により計算された地
点間距離と代表媒体伝達速度との比を前記第1の地点か
ら前記第2の地点への地点間媒体伝達時間として計算
し、前記第1の地点から前記第2の地点へ媒体が移動し
ないと判定された場合には前記第1の地点から前記第2
の地点への地点間媒体伝達時間を所定の大きな値とし、
前記第2の地点から前記第1の地点へ媒体が移動すると
判定された場合には前記地点間距離と前記代表媒体伝達
速度との比を前記第2の地点から前記第1の地点への地
点間媒体伝達時間として計算し、前記第2の地点から前
記第1の地点へ媒体が移動しないと判定された場合には
前記第2の地点から前記第1の地点への地点間媒体伝達
時間を所定の大きな値とする距離対媒体速度比算出手段
とを有することを特徴とする請求項3記載のデータマイ
ニング装置。
6. The medium transmission time calculating means moves the medium from the first point to the second point according to whether or not the angle difference calculated by the angle difference calculating means is within a predetermined range. Angle difference determining means for determining whether the medium moves from the second point to the first point, and determining that the medium moves from the first point to the second point. In this case, the ratio between the point-to-point distance calculated by the distance calculating means and the representative medium transmission speed is calculated as the point-to-point medium transmission time from the first point to the second point. If it is determined that the medium does not move from the point to the second point, the second point is moved from the first point to the second point.
The point-to-point medium transmission time to the point is a predetermined large value,
When it is determined that the medium moves from the second point to the first point, the ratio between the point-to-point distance and the representative medium transmission speed is set to a point from the second point to the first point. It is calculated as the intermediary medium transmission time, and when it is determined that the medium does not move from the second point to the first point, the interpoint medium transmission time from the second point to the first point is calculated. 4. A data mining apparatus according to claim 3, further comprising a distance-to-medium speed ratio calculating means for setting a predetermined large value.
【請求項7】 媒体伝達時間算出手段は、代表媒体伝達
速度の、第1の地点と第2の地点を結ぶ直線の方向の成
分を距離方向速度として計算する距離方向速度算出手段
と、前記第1の地点を起点として前記第2の地点を通る
半直線と前記距離方向速度の向きとが一致している場合
には前記地点間距離と前記距離方向速度の大きさとの比
を前記第1の地点から前記第2の地点への地点間媒体伝
達時間として計算し、前記半直線と前記距離方向速度の
向きとが一致していない場合には前記第1の地点から前
記第2の地点への地点間媒体伝達時間を所定の大きな値
とし、前記第2の地点を起点として前記第1の地点を通
る半直線と前記距離方向速度の向きとが一致している場
合には前記地点間距離と前記距離方向速度の大きさとの
比を前記第2の地点から前記第1の地点への地点間媒体
伝達時間として計算し、前記半直線と前記距離方向速度
の向きとが一致していない場合には前記第2の地点から
前記第1の地点への地点間媒体伝達時間を所定の大きな
値とする距離対媒体速度比算出手段とを有することを特
徴とする請求項3記載のデータマイニング装置。
7. The medium transmission time calculation means includes: a distance direction speed calculation means for calculating a component of a representative medium transmission speed in a direction of a straight line connecting the first point and the second point as a distance direction speed; If the direction of the distance direction speed coincides with the half line passing through the second point starting from the first point, the ratio of the distance between the points and the magnitude of the distance direction speed is set to the first point. Calculated as a point-to-point medium transmission time from a point to the second point, and if the direction of the half-line and the distance direction velocity do not match, the first point to the second point The point-to-point medium transmission time is a predetermined large value, and when the direction of the distance direction velocity coincides with the half-line passing through the first point with the second point as a starting point, the point-to-point distance and The ratio to the magnitude of the distance direction velocity is calculated at the second point. From the second point to the first point when the direction of the half-line is not coincident with the direction of the distance speed. 4. A data mining apparatus according to claim 3, further comprising a distance-to-medium speed ratio calculating means for setting the inter-medium transmission time to a predetermined large value.
【請求項8】 媒体伝達速度系列が各地点毎に得られて
いる場合に、各地点対の2地点にそれぞれ対応する2つ
の前記媒体伝達速度系列から地点間代表速度系列を計算
する地点間代表速度系列算出手段を備え、 媒体速度分類手段は、前記媒体伝達速度系列の代わりに
前記地点間代表速度系列を使用することを特徴とする請
求項1記載のデータマイニング装置。
8. A point-to-point representative calculating a point-to-point representative speed sequence from two medium transmission speed sequences respectively corresponding to two points of each point pair when a medium transmission speed sequence is obtained for each point. 2. The data mining apparatus according to claim 1, further comprising speed sequence calculating means, wherein the medium speed classifying means uses the point-to-point representative speed sequence instead of the medium transmission speed sequence.
【請求項9】 媒体伝達速度系列を構成する各時点にお
ける媒体伝達速度を、その媒体伝達速度およびその近傍
の1つまたは複数の時点における媒体伝達速度の平均に
変換して媒体伝達速度系列を平滑化媒体伝達速度系列に
変換する媒体速度系列平滑化手段を備え、 媒体速度分類手段は、前記媒体伝達速度系列の代わり
に、前記媒体速度系列平滑化手段により変換された前記
平滑化媒体伝達速度系列を使用することを特徴とする請
求項1記載のデータマイニング装置。
9. The medium transmission speed sequence at each time point constituting the medium transmission speed sequence is converted into an average of the medium transmission speed and the medium transmission speed at one or more time points near the medium transmission speed to smooth the medium transmission speed sequence. Medium speed series smoothing means for converting to a medium transmission speed series, wherein the medium speed classification means replaces the medium transmission speed series with the smoothed medium transmission speed series converted by the medium speed series smoothing means. The data mining device according to claim 1, wherein the data mining device is used.
【請求項10】 ラベル値対生成手段は、ラベル値系列
のうち所定の時間幅に含まれる部分系列をラベル値部分
系列として抽出するラベル値部分系列抽出手段と、前記
ラベル値部分系列の最初の時点におけるラベル値が高頻
度ラベル値である場合にそのラベル値を第1の高頻度ラ
ベル値とする高頻度ラベル値検出手段と、前記第1の高
頻度ラベル値の出現時点での、前記第1の高頻度ラベル
値の出現地点を起点とした場合の地点間媒体伝達時間が
所定の最大伝達時間以下である地点を伝達時間制約満足
地点として抽出する地点抽出手段と、前記ラベル値部分
系列における前記伝達時間制約満足地点に関するラベル
値のうち、前記ラベル値部分系列の最初の時点からその
地点に対応する地点間媒体伝達時間以降のラベル値であ
り、かつ前記高頻度ラベル値であるラベル値を第2の高
頻度ラベル値とし、第1の高頻度ラベル値および第2の
高頻度ラベル値で高頻度ラベル値組候補を生成するラベ
ル値対抽出手段とを有することを特徴とする請求項1記
載のデータマイニング装置。
10. A label value pair generating means, comprising: a label value subsequence extracting means for extracting a subsequence included in a predetermined time width from the label value series as a label value subsequence; A high-frequency label value detecting means for setting the label value as a first high-frequency label value when the label value at the time is a high-frequency label value; and Point extraction means for extracting, as a transmission time constraint satisfaction point, a point whose medium transmission time between points is less than or equal to a predetermined maximum transmission time when the appearance point of the high-frequency label value of 1 is a starting point; Among the label values related to the transmission time constraint satisfying point, the label value is a label value after the point-to-point medium transmission time corresponding to the point from the first time point of the label value subsequence, and Label value pair extracting means for setting a label value being a label value as a second high-frequency label value and generating a high-frequency label value set candidate with the first high-frequency label value and the second high-frequency label value The data mining device according to claim 1, wherein:
【請求項11】 ラベル値対生成手段は、ラベル値部分
系列抽出手段によるラベル値部分系列から予め指定され
た要素に対応するものを抽出する要素指定抽出手段を有
し、 ラベル値対抽出手段は、前記ラベル値部分系列抽出手段
による前記ラベル値部分系列の代わりに前記要素指定抽
出手段により抽出された系列を使用することを特徴とす
る請求項10記載のデータマイニング装置。
11. The label value pair generation means includes element designation extraction means for extracting a value corresponding to a predetermined element from the label value subsequence by the label value subsequence extraction means. 11. The data mining apparatus according to claim 10, wherein a sequence extracted by the element designation extracting unit is used instead of the label value subsequence by the label value subsequence extracting unit.
【請求項12】 地点抽出手段は、所定の無相関地点対
のうち第1の高頻度ラベル値の出現地点を含むものを検
出し、前記無相関地点対のうちの前記第1の高頻度ラベ
ル値の出現地点でない地点を伝達時間制約満足地点から
削除することを特徴とする請求項10記載のデータマイ
ニング装置。
12. A point extracting means for detecting a point including an appearance point of a first high-frequency label value among predetermined non-correlation point pairs, and detecting the first high-frequency label among the non-correlation point pairs. 11. The data mining apparatus according to claim 10, wherein a point that is not a value appearance point is deleted from a transmission time constraint satisfaction point.
【請求項13】 媒体が空間内を移動する速度である媒
体伝達速度の範囲と前記媒体伝達速度の各範囲を代表す
る代表媒体伝達速度との対応関係に基づいて、前記媒体
伝達速度の時系列である媒体伝達速度系列を構成する各
媒体伝達速度を前記代表媒体伝達速度に変換して代表媒
体伝達速度系列を生成するステップと、 2つの地点の空間的情報および各代表媒体伝達速度に基
づいて、前記2つの地点を第1の地点および第2の地点
として前記第1の地点から前記第2の地点へ媒体が移動
する時間および前記第2の地点から前記第1の地点へ媒
体が移動する時間をそれぞれ地点間媒体伝達時間として
計算するステップと、 前記媒体に依存する1つまたは複数の要素に関するラベ
ル値の時系列であるラベル値系列での各高頻度ラベル値
候補の出現頻度をカウントするステップと、前記出現頻
度が所定の下限値以上である高頻度ラベル値候補を高頻
度ラベル値とするステップと、 2つの前記高頻度ラベル値を第1のラベル値および第2
のラベル値として組み合わせたラベル値組のうち、前記
第1のラベル値の出現時点と前記第2のラベル値の出現
時点との時間差が前記第1のラベル値の出現時点での前
記第1のラベル値の出現地点と前記第2のラベル値の出
現地点との間の前記地点間媒体伝達時間以上でありかつ
所定の最大伝達時間以下であり、さらに前記ラベル値系
列に出現するものを高頻度ラベル値組候補とするステッ
プと、高頻度ラベル値組候補を構成するラベル値のうち
の時間的に最後のラベル値と残りのラベル値のうちの1
つとで構成される2ラベル値組の時間的に前側のラベル
値を前側ラベル値とし時間的に後側のラベル値を後側ラ
ベル値として、すべての前記前側ラベル値に関して、前
記前側ラベル値の出現時点と前記後側ラベル値の出現時
点との時間差が前記前側ラベル値の出現時点での前記前
側ラベル値の出現地点から前記後側ラベル値の出現地点
への地点間媒体伝達時間以上であるという制約条件を満
たすか否かを判定するステップと、 前記制約条件を満たすと判定された場合にのみ前記ラベ
ル値系列での各高頻度ラベル値組候補の出現頻度をカウ
ントするステップと、 前記出現頻度が所定の下限値以上である高頻度ラベル値
組候補を高頻度ラベル値組とするステップと、 複数の異なる高頻度ラベル値組を組み合わせて新たな高
頻度ラベル値組候補を生成するステップとを備えたデー
タマイニング方法。
13. A time series of the medium transmission speed based on a correspondence between a range of a medium transmission speed that is a speed at which a medium moves in a space and a representative medium transmission speed representing each range of the medium transmission speed. Converting each medium transmission speed constituting the medium transmission speed sequence into a representative medium transmission speed to generate a representative medium transmission speed sequence, based on spatial information of two points and each representative medium transmission speed The time at which the medium moves from the first point to the second point, and the medium moves from the second point to the first point, using the two points as a first point and a second point. Calculating each time as a point-to-point medium transmission time; and the appearance of each high frequency label value candidate in a label value series that is a time series of label values for one or more elements depending on the medium. A step of counting the degrees, the steps of frequency of occurrence and high frequency label value high frequency label value candidate is equal to or higher than a predetermined lower limit value, two of the high frequency label value first label value and the second
The time difference between the present point of time of the first label value and the present point of time of the second label value is the first label value at the present point of time of the first label value. The frequency between the point-to-point medium transmission time between the point of appearance of the label value and the point of appearance of the second label value is longer than or equal to the predetermined maximum transmission time, and appears in the label value series at a high frequency. A label value set candidate; and a temporally last label value and one of the remaining label values among the label values constituting the frequent label value set candidates.
The label value on the temporally front side of the two label value set composed of two labels is the front label value, and the label value on the temporal side is the rear label value. The time difference between the outgoing current time and the outgoing current time of the rear label value is equal to or longer than the point-to-point medium transmission time from the appearance point of the front label value at the present time of the front label value to the appearance point of the rear label value. Determining whether or not the constraint condition is satisfied; and counting the appearance frequency of each high-frequency label value set candidate in the label value series only when it is determined that the constraint condition is satisfied; A step of setting a high-frequency label value set candidate whose frequency is equal to or higher than a predetermined lower limit value as a high-frequency label value set; and combining a plurality of different high-frequency label value sets with a new high-frequency label value set candidate. Data mining method which includes a step of forming.
【請求項14】 コンピュータを、 媒体が空間内を移動する速度である媒体伝達速度の範囲
と前記媒体伝達速度の各範囲を代表する代表媒体伝達速
度との対応関係に基づいて、前記媒体伝達速度の時系列
である媒体伝達速度系列を構成する各媒体伝達速度を前
記代表媒体伝達速度に変換して代表媒体伝達速度系列を
生成する媒体速度分類手段、 各地点の空間的情報および前記代表媒体伝達速度に基づ
いて、各地点対の2地点を第1の地点および第2の地点
として前記第1の地点から前記第2の地点へ媒体が移動
する時間および前記第2の地点から前記第1の地点へ媒
体が移動する時間をそれぞれ地点間媒体伝達時間として
計算する計算手段、 高頻度ラベル値組候補を構成するラベル値のうちの時間
的に最後のラベル値と残りのラベル値のうちの1つとで
構成される2ラベル値組の時間的に前側のラベル値を前
側ラベル値とし時間的に後側のラベル値を後側ラベル値
として、すべての前記前側ラベル値に関して、前記前側
ラベル値の出現時点と前記後側ラベル値の出現時点との
時間差が前記前側ラベル値の出現時点での前記前側ラベ
ル値の出現地点から前記後側ラベル値の出現地点への地
点間媒体伝達時間以上であるという制約条件を満たすか
否かを判定するラベル値間制約判定手段、 前記媒体に依存する1つまたは複数の要素に関するラベ
ル値の時系列であるラベル値系列での各高頻度ラベル値
候補の出現頻度をカウントし、前記ラベル値間制約判定
手段により前記制約条件を満たすと判定された場合にの
み前記ラベル値系列での各高頻度ラベル値組候補の出現
頻度をカウントするラベル値組検証手段、 前記出現頻度が所定の下限値以上である高頻度ラベル値
候補または高頻度ラベル値組候補をそれぞれ高頻度ラベ
ル値または高頻度ラベル値組とする高頻度ラベル値組抽
出手段、 2つの前記高頻度ラベル値を第1のラベル値および第2
のラベル値として組み合わせたラベル値組のうち、前記
第1のラベル値の出現時点と前記第2のラベル値の出現
時点との時間差が前記第1のラベル値の出現時点での前
記第1のラベル値の出現地点と前記第2のラベル値の出
現地点との間の前記地点間媒体伝達時間以上でありかつ
所定の最大伝達時間以下であり、さらに前記ラベル値系
列に出現するものを高頻度ラベル値組候補とするラベル
値対生成手段、 複数の異なる前記高頻度ラベル値組を組み合わせて新た
な高頻度ラベル値組候補を生成する高頻度ラベル値組候
補生成手段として機能させるためのプログラムを記録し
たコンピュータ読み取り可能な記録媒体。
14. The computer according to claim 1, wherein said medium transmission speed is determined based on a correspondence relationship between a range of a medium transmission speed, which is a speed at which a medium moves in a space, and a representative medium transmission speed representing each range of said medium transmission speed. Medium speed classifying means for converting each medium transmission speed constituting the medium transmission speed sequence which is a time series into the representative medium transmission speed to generate a representative medium transmission speed sequence, spatial information of each point and the representative medium transmission Based on the speed, two points of each point pair are defined as a first point and a second point, and the time required for the medium to move from the first point to the second point and the first point from the second point to the first point. Calculating means for calculating the time required for the medium to move to the point as the medium-to-point medium transmission time, of the temporally last label value of the label values constituting the high-frequency label value set candidate and the remaining label value A label value on the temporally front side of the two label value set constituted by one of the following label values and a label value on the temporally rear side as the rear label value, and for all the front label values, the front label The time difference between the present time of the value output and the present time of the rear label value is equal to or longer than the point-to-point medium transmission time from the appearance point of the front label value to the appearance point of the rear label value at the present time of the front label value. Label value constraint determination means for determining whether or not the constraint condition is satisfied. Each high-frequency label value candidate in a label value series which is a time series of label values for one or more elements depending on the medium. Is counted, and the frequency of appearance of each high-frequency label value set candidate in the label value series is counted only when it is determined that the constraint condition is satisfied by the label value constraint determining unit. Label value set verification means, high frequency label value set extraction means for setting the high frequency label value candidate or the high frequency label value set candidate whose appearance frequency is equal to or higher than a predetermined lower limit value to be a high frequency label value or a high frequency label value set, respectively The two frequent label values into a first label value and a second
The time difference between the present point of time of the first label value and the present point of time of the second label value is the first label value at the present point of time of the first label value. The frequency between the point-to-point medium transmission time between the point of appearance of the label value and the point of appearance of the second label value is longer than or equal to the predetermined maximum transmission time, and appears in the label value series at a high frequency. Label value pair generating means as label value set candidates; a program for functioning as a high frequency label value set candidate generating means for generating a new high frequency label value set candidate by combining a plurality of different high frequency label value sets. A computer-readable recording medium that has been recorded.
JP2000013406A 2000-01-21 2000-01-21 Device and method for mining data and recording medium Abandoned JP2001202383A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000013406A JP2001202383A (en) 2000-01-21 2000-01-21 Device and method for mining data and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000013406A JP2001202383A (en) 2000-01-21 2000-01-21 Device and method for mining data and recording medium

Publications (1)

Publication Number Publication Date
JP2001202383A true JP2001202383A (en) 2001-07-27

Family

ID=18540999

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000013406A Abandoned JP2001202383A (en) 2000-01-21 2000-01-21 Device and method for mining data and recording medium

Country Status (1)

Country Link
JP (1) JP2001202383A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002351898A (en) * 2001-05-23 2002-12-06 Internatl Business Mach Corp <Ibm> Process method, process system and program for graph construction data
WO2013128530A1 (en) * 2012-02-27 2013-09-06 日本電気株式会社 Event correlation rule detection system, event correlation rule detection method, and event correlation detection program
JP2020197892A (en) * 2019-06-03 2020-12-10 三菱電機株式会社 Knowledge base generating device, knowledge base generating method and knowledge base generating program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002351898A (en) * 2001-05-23 2002-12-06 Internatl Business Mach Corp <Ibm> Process method, process system and program for graph construction data
WO2013128530A1 (en) * 2012-02-27 2013-09-06 日本電気株式会社 Event correlation rule detection system, event correlation rule detection method, and event correlation detection program
JPWO2013128530A1 (en) * 2012-02-27 2015-07-30 日本電気株式会社 Event correlation rule detection system, event correlation rule detection method, and event correlation rule detection program
JP2020197892A (en) * 2019-06-03 2020-12-10 三菱電機株式会社 Knowledge base generating device, knowledge base generating method and knowledge base generating program
JP7313769B2 (en) 2019-06-03 2023-07-25 三菱電機株式会社 Knowledge base generation device, knowledge base generation method, and knowledge base generation program

Similar Documents

Publication Publication Date Title
Hu et al. If-matching: Towards accurate map-matching with information fusion
Hung et al. Clustering and aggregating clues of trajectories for mining trajectory patterns and routes
Potamias et al. Sampling trajectory streams with spatiotemporal criteria
Yang et al. Travel cost inference from sparse, spatio temporally correlated time series using markov models
US9747805B2 (en) Computing a similarity measure over moving object trajectories
Won et al. Trajectory clustering in road network environment
Yan et al. SeTraStream: semantic-aware trajectory construction over streaming movement data
KR100923723B1 (en) Method for clustering similar trajectories of moving objects in road network databases
CN111259444B (en) Track data label clustering method fusing privacy protection
CN110162997B (en) Anonymous privacy protection method based on interpolation points
CN109359135B (en) Time sequence similarity searching method based on segment weight
Wang et al. Personalized route recommendation with neural network enhanced search algorithm
Shafique et al. Recommending most popular travel path within a region of interest from historical trajectory data
CN106570311A (en) Flight path continuity assessment method and system under complex conditions
CN113611115A (en) Vehicle track clustering method based on road network sensitive characteristics
JP2001202383A (en) Device and method for mining data and recording medium
JP2003256757A (en) Space data analysis device, space data analysis method, and space data analysis program
Fang et al. GPSClean: a framework for cleaning and repairing GPS data
CN109740091B (en) Behavior cognition-based user network behavior prediction system and method
Zhang et al. Rcivmm: A route choice-based interactive voting map matching approach for complex urban road networks
JP6379943B2 (en) Moving path integration method, apparatus, and program
Dewan et al. Som-tc: Self-organizing map for hierarchical trajectory clustering
JP2001202246A (en) Data mining device and data mining method and recording medium
Lin et al. Brownian bridge model for high resolution location predictions
CN111967504B (en) Similar trajectory judgment method with important point constraint

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060404

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20060510