CN114004286A - 一种基于频繁项挖掘的多维时间序列同步模体发现方法 - Google Patents
一种基于频繁项挖掘的多维时间序列同步模体发现方法 Download PDFInfo
- Publication number
- CN114004286A CN114004286A CN202111214295.9A CN202111214295A CN114004286A CN 114004286 A CN114004286 A CN 114004286A CN 202111214295 A CN202111214295 A CN 202111214295A CN 114004286 A CN114004286 A CN 114004286A
- Authority
- CN
- China
- Prior art keywords
- motif
- item
- frequent
- dimensional
- subsequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000005065 mining Methods 0.000 title claims abstract description 26
- 230000001360 synchronised effect Effects 0.000 claims abstract description 47
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000006386 neutralization reaction Methods 0.000 claims description 3
- 238000005295 random walk Methods 0.000 description 4
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于频繁项挖掘的多维时间序列同步模体发现方法,首先,使用单维时间序列模体挖掘方法发现单个维度内的K‑模体;根据多个维度中每个模体实例出现的时间,构造同步模体实例;其次,每个同步模体实例视为关联规则挖掘中的一个事务,每个模体实例作为事务中的一个事务项,将多维模体挖掘转化为频繁项集挖掘;然后,利用改进的Apriori挖掘同步模体实例中的频繁模体实例集;最后,根据预定的支持度阈值,得到最终的多维模体。相比较与目前已有的多维模体挖掘方法只能发现最相近的模体,本发明能够挖掘出多维时间序列中同时出现或者在时间上相近出现的模体,同时发现多个维度上的多种模体实例组合可能。
Description
技术领域
本发明属于信息技术领域,具体涉及一种基于频繁项挖掘的多维时间序列同步模体发现方法。
背景技术
模体被定义为近似重复的序列、形状、频繁的趋势、重复的模式等。模体挖掘可以通过无监督的方式地发现时间序列数据中重复出现、未知的、有意义的片段,进而发现时间序列中的潜在规则和特定事件。随着大数据时代的到来,在科学实验和正常的业务操作过程中时刻都在产生大量的数据,同时这些数据呈现多变量、高维度、大容量等特点。多维时间序列模体是指在多维时间序列的若干个维度上同时出现的重复模式或者片段。多维时间序列模体分析可以从由时序序列组成的多维序列数据中寻找有用的信息,在发现时序序列数据中内在行为和规律的同时,反映不同维度时序序列之间的相互关系。在环境管理、医疗健康、基因工程等领域,进行多维模体挖掘具有重要的现实意义。
定义1.K-模体。给定一个单维时间序列T,子序列长度为m和距离阈值范围R。在距离阈值范围R内,如果一个子序列C1在T中非平凡匹配的子序列数最多,则C1和这些匹配的子序列共同构成T中最重要的模体,即1-模体。同理,K-模体是T中子序列Ck非平凡匹配子序列数量第K多的子序列集合,并且满足D(Ck,Ci)>2R,其中1≤i<k,D(,)表示距离度量方式。
定义2.多维同步模体。给定阈值td和两个不同维度的单维模体S1={A1,A2}、S2={B1,B2},其中A1、A2和B1、B2分别表示模体S1和S2的模体实例。如果满足T(A1,B1)<td且T(A2,B2)<td,则S1和S2构成一个2维模体;其中T(,)计算两个模体实例的开始位置之差。
发明内容
发明目的:为了克服现有技术中存在的问题,本发明提供了一种基于频繁项挖掘的多维时间序列同步模体发现方法,能够发现多维时间序列中同时出现或者相近出现的多实例模体信息,在给定阈值下,给出多个维度上所有的多实例模体的组合。
技术方案:本发明提供了一种基于频繁项挖掘的多维时间序列同步模体发现方法,具体包括以下步骤:
(1)在每个维度发现单维K-模体,即:1-模体、2-模体、…、以及k-模体;
(2)利用单维K-模体实例构造同步模体实例集SI;
(3)将所有同步模体实例集转换成事务集T:提取同步模体实例集中的每个模体实例的标识,每个标识描述一个事务项,即同一个维度同一个体中的所有模体实例都认为是同一个事务项,同步模体实例集中的标识构成事务t;
(4)设置支持度计数minsup,采用改进Apriori算法对TS进行频繁项集挖掘,并输出频繁项集;
(5)多维模体的输出:根据挖掘出的频繁项集到同步模体实例集MI中检索对应的模体实例。
进一步地,所述步骤(1)包括以下步骤:
(11)提取子序列:采用长度为w的滑动窗口对时间序列按照步长1截取生成子序列;
(12)计算子序列之间的距离矩阵:计算任意两个子序列si和sj之间的距离,形成距离矩阵Dij,Dij表示子序列si和sj之间的距离;采用两个子序列之间的相关系数矩表示两个子序列之间的相似程度,相关系数越大表示相似程度越大;
(13)设置相关系数矩阵中相关系数低于阈值c的元素为0,为0的元素表示两个子序列不相似;
(14)计算每个子序列si的相似子序列个数:将所有子序列的集合作为初始处理集So,剔除所有与si相关系数为0的子序列;剔除So中与当前子序列si平凡匹配的子序列;将So中将与当前子序列si距离最近的子序列smi作为候选加入si的相似集Ss中,并将smi从So中剔除;剔除So中与smi平凡匹配的子序列;递归处理子序列So,直到So中子序列为空;记录子序列si的相似子序列的位置以及总个数;
(15)提取K-模体:提取相似子序列总数前k多的子序列及其相似子序列,相似子序列最多的子序列及其相似子序列构成1-模体,相似子序列第二多的子序列及其相似子序列构成2-模体,依次类推。
进一步地,所述步骤(2)包括以下步骤:
(21)使用四元组[d,k,t,l]描述所有的单维模体实例mi,其中,d表示该模体实例所属的维度;k表示属于该d维度中第k重要的模体;t描述该模体实例在原始时间序列中的开始位置;l描述该模体实例的标识,标识中包括所在维度信息以及所在的模体信息,标识的格式为:“M”+两位维度标识+两位模体标识;若维数和模体数量更加,可以扩展编码位数;对模体实例分配标识后,同一维度同一模体中的所有模体实例的标识都相同;
(22)基于预先定义的时间阈值td,将满足阈值条件的不同维度的单维模体实例置入同一个同步模体实例集SI中;对于两个不同维度的模体实例[d1,k1,t1,l1]和[d2,k2,t2,l2],如果满足条件|t1-t2|<td,则这两个模体实例属于同步模体实例;多个互相同步的模体实例构成一个同步模体实例集,在同一个同步模体实例集中任意两个实例之间的时间距离小于td;其中td取值为模体实例长度w的百分比,用户根据业务领域需求设置,td取值越小,模体实例同步越高。
进一步地,所述步骤(4)包括以下步骤:
(41)产生频繁项集和候选项集时,项集内部按照项所在的维度顺序对项进行排序,假设i<j,则第i维的项放置第j维的项前面;频繁项集的支持度minsup>=2;
(42)对T中所有事务中的项进行计数,去掉支持度小于minsup的项,所有支持度不小于minsup的项组成频繁1项集的集合F1;
(43)采用F1*F1产生候选2项集,即将F1中任意两个非同一个维度的项进行组合,产生候选2项集集合CF2;
(44)采用Fk-1*Fk-1的方式利用k-1频繁项集产生候选k项集(k>3);合并两个k-1频繁项产生候选k项集,合并的两个k-1频繁项满足:这两个k-1频繁项的前k-2个项相同且第k-1项不属于同一个维度的;
(45)统计候选项集集CFk中k项集的支持度计数,剔除CFk中支持度计数小于minsup的k项集,剩下的k项集构成频繁k项集集合Fk;针对事务ti,产生事务项的所有k项集集合;对CFk中的任一k项集,若该k项集在当前事务ti产生的k项集集合中,则该k项集支持度计数增加1,循环处理完所有事务;
进一步地,步骤(5)所述输出多维模体的具体操作为:根据挖掘出的频繁项集到同步模体实例集中检索对应的模体实例;若同步模体实例集包含该频繁项集的所有项,则输出频繁项集中项对应的模体实例。
有益效果:与现有技术相比,本发明的有益效果:1、现有方法主要挖掘的是单维模体或者多维时间序列的最近邻模体,本发明可以挖掘多维时间序列中的多实例模体;2、本发明充分利用了已有的成熟的频繁项集算法,同时结合多维时间序列模体的特点改进了利用k-1频繁项集产生候选k项集时的处理,提高了效率;3、本发明可以输出任意维度组合的高于支持度的模体。
附图说明
图1为本发明的流程图;
图2为同步模体实例集示例;
图3为不同数据集、不同时刻多维模体结果图;
图4为Dataset1下不同时刻多维模体结果图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
本发明提出一种基于频繁项挖掘的多维时间序列同步模体发现方法,主要包括:挖掘单维的K-模体、构造频繁项集挖掘的事务集、采用Apriori挖掘频繁项集和输出多维时间序列,如图1所示,具体包括以下步骤:
步骤1:在每个维度发现单维K-模体,即在每个维度上挖掘前k个模体:1-模体、2-模体、…、以及k-模体。具体包括如下步骤:
(1)提取子序列。采用长度为w的滑动窗口对时间序列按照步长1截取生成子序列。
(2)计算子序列之间的距离矩阵。计算任意两个子序列si和sj之间的距离,形成距离矩阵D,Dij表示子序列si和sj之间的距离。本发明采用两个子序列之间的相关系数矩表示两个子序列之间的相似程度,相关系数越大表示相似程度越大。
(3)设置相关系数矩阵中相关系数低于阈值c的元素为0(表示两个子序列不相似)。阈值c由用户根据需要设置,可以在分析的过程中设置不同的c,获得不同的模体数量。
(4)计算每个子序列si的相似子序列个数。将所有子序列的集合作为初始处理集So,剔除所有与si相关系数为0的子序列;剔除So中与当前子序列si平凡匹配的子序列;将So中将与当前子序列si距离最近的子序列smi作为候选加入si的相似集Ss中,并将smi从So中剔除;剔除So中与smi平凡匹配的子序列;递归处理子序列So,直到So中子序列为空。记录子序列si的相似子序列的位置以及总个数。
(5)提取K-模体。提取相似子序列总数前k多的子序列及其相似子序列,相似子序列最多的子序列及其相似子序列构成1-模体,相似子序列第二多的子序列及其相似子序列构成2-模体,依次类推。
步骤2:利用单维模体实例构造同步模体实例集SI。同步模体实例集是同时出现或者出现时间相近的多个维度模体实例的集合,一个同步模体实例集可能包含多个维度的模体实例,但是一个维度只会包含一个实例。如图2所示,模体实例集SI1包含第1,2,3维各一个实例,这是三个模体实例起始时间相近;模体实例集SI2包含第1,2维各一个实例。构造同步模体实例集包括如下步骤:
(1)使用四元组[d,k,t,l]描述所有的单维模体实例mi,即:
mi=[d,k,t,l] (1)
其中,d表示该模体实例所属的维度,k表示属于该d维度中第k重要的模体,t表示该模体实例在原始时间序列中的开始位置,l描述该模体实例的标识。标识中包括所在维度信息以及所在的模体信息,标识的格式为:“M”+两位维度标识+两位模体标识,如某模体实例为第1维度中2-模体的实例,则其标识为:M0102。若维数和模体数量更加,可以扩展编码位数。如第1维中2-模体中起始位置为100的模体实例其四元组为[1,2,100,‘M0102’]。对模体实例分配标识后,同一维度同一模体中的所有模体实例的标识都相同。所有模体实例构成模体实例集MI,即:
MI={所有模体实例mi的集合} (2)
(2)基于预先定义的时间阈值td,将满足阈值条件的不同维度的单维模体实例置入同一个同步模体实例集SI中。对于两个不同维度的模体实例[d1,k1,t1,l1]和[d2,k2,t2,l2],如果满足条件|t1-t2|<td,则这两个模体实例属于同步模体实例。多个互相同步的模体实例构成一个同步模体实例集,在同一个同步模体实例集中任意两个实例之间的起始时间距离小于td,SI的描述为:
其中,mii.d表示SI中第i个模体实例所属维度。td取值为模体实例长度w的百分比,比如10%,或者用户根据业务领域需求设置。模体实例之间同步性要求越高,td的取值就需要越小。
步骤3:将所有同步模体实例集转换成事务T。提取同步模体实例集中的每个模体实例的标识,每个标识描述一个事务项,即同一个维度同一个体中的所有模体实例都认为是同一个事务项,同步模体实例集中的标识构成事务t:
t={一个同步模体实例集中实例的标识} (4)
如图2中同步模体实例集SI1转换的事务t1为:{M0101,M0202,M0301}。所有的同步模体实例集形成的事务构成事务集T。
步骤4:假设多维时间序列维数为p,设置支持度计数minsup,一般minsup>=2,采用改进的Apriori算法对T进行频繁项集挖掘,并输出频繁项集。具体步骤如下:
(1)对T中所有事务中的项进行计数,所有支持度不小于minsup的项组成频繁1项集集合F1。如图2中的F1={{M0101},{M0201},{M0202},{M0301}}。
(2)采用F1*F1产生候选2项集,即将F1中任意两个非同一个维度的项进行组合(因为同一个维度的项是不可能存在同一个事务中),产生候选2项集集合CF2。如图2中,产生的候选2项集的集合CF2={{M0101,M0201},{M0101,M0202},{M0101,M0301},{M0101,M0301}}。在产生候选项集时,在项集中,将项的顺序按照维度顺序给出,即,假设i<j,则在项集中,第i维的项放置第j维的项前面。
(3)根据候选2项集集合CF2生成频繁2项集集合F2。统计CF2中2项集的支持度计数。针对事务ti,两两组合该事务的项生成2项集集合。如SI1所对应的t1的2项集集合为:{{M0101,M0202},{M0101,M0301},{M0101,M0301}}。对CF2中的任一2项集,若该2项集在当前事务ti产生的2项集集合中,则该2项集支持度计数增加1。循环处理完所有事务。剔除CF2中支持度计数小于minsup的2项集,剩下的2项集构成频繁2项集集合F2。
(4)采用Fk-1*Fk-1的方式两两组合k-1频繁项集产生候选k项集(k>3),所有候选k项集构成候选k项集集合CFk。要求:两个k-1频繁项集的前k-2项要相同,两个k-1频繁项集的第k-1项要属于不同的维度。步骤包括:
a)构建临时集合Fk-1’,Fk-1’内容和Fk-1相同。
b)取出Fk-1’中的一个k-1频繁项集fk-1_i。
c)在CFk中查找是否有候选k项集包含fk-1_i,若有转b)。
d)在Fk-1’中检索与fk-1_i前k-2个项相同,同时第k-1项不属于同一个维度的k-1项集fk-1_i’;找不到则转b)。
e)从Fk-1’中去掉fk-1_i’,合并fk-1_i和fk-1_i’,构成候选k项集加入CFk。项集中,将项的顺序按照所在维度顺序给出,即,假设i<j,则在项集中,第i维的项放置第j维的项前面。
f)若Fk-1’中项集处理完,则结束,否则转b)。
(5)根据候选k项集集合CFk,参考步骤(3)生成频繁k项集集合Fk。
步骤5:多维模体的输出。根据挖掘出的频繁项集到同步模体实例集MI中检索对应的模体实例,若同步模体实例集的实例标识包含频繁项集,则根据相应的模体实例信息输出模体实例。如挖掘出{M0101,M0201}为频繁2项集,即第1维1-模体中的实例和第2维1-模体中的实例构成多维模体,根据该频繁项集标识,遍历所有的同步模体实例集,在同步模体实例集SI1,SI2中可以找到这两个频繁项对应的模体实例。如图2中SI1中有两个模体实例的标识分别和{M0101,M0201}中项相同,则分别输出SI1中标识为M0101和标识为M0201的模体实例的四元组信息。
本实施方式构造随机游走数据。随机产生长度为n的随机数,构造时间序列{X1,X2,…,Xn},并对序列中的每个值去均值化,使用如下公式计算得到一个新序列{x1,x2,…,xn}。
使用如下公式计算新序列{x1,x2,…,xn}的部分和,构造随机游走序列Y={y1,y2,…,yn}:
在随机游走数据Y中植入UCR数据集,如表1所示,将UCR数据集中每个模体实例,使用长度两倍于模体实例的随机游走数据分离连接,以模拟真实世界的应用程序。
表1合成数据集描述表
基于合成数据集Dataset1,固定模体长度为植入模式的长度80,滑动窗口大小为500,基本窗口大小为100,相关系数阈值为0.99。验证本发明可以有效地找到多维模体,实验结果如图3和图4所示。分析图3和图4可以发现,在合成数据集中,本发明可以在多维流时间序列中,将多维模体结果挖掘并展示其有效性。
Claims (5)
1.一种基于频繁项挖掘的多维时间序列同步模体发现方法,其特征在于,包括以下步骤:
(1)在每个维度发现单维K-模体,即:1-模体、2-模体、…、以及k-模体;
(2)利用单维K-模体实例构造同步模体实例集SI;
(3)将所有同步模体实例集转换成事务T:提取同步模体实例集中的每个模体实例的标识,每个标识描述一个事务项,即同一个维度同一个体中的所有模体实例都认为是同一个事务项,同步模体实例集中的标识构成事务t;
(4)设置支持度计数minsup,采用改进Apriori算法对TS进行频繁项集挖掘,并输出频繁项集;
(5)输出多维模体。
2.根据权利要求1所述的基于频繁项挖掘的多维时间序列同步模体发现方法,其特征在于,所述步骤(1)包括以下步骤:
(11)提取子序列:采用长度为w的滑动窗口对时间序列按照步长1截取生成子序列;
(12)计算子序列之间的距离矩阵:计算任意两个子序列si和sj之间的距离,形成距离矩阵Dij,Dij表示子序列si和sj之间的距离;采用两个子序列之间的相关系数矩表示两个子序列之间的相似程度,相关系数越大表示相似程度越大;
(13)设置相关系数矩阵中相关系数低于阈值c的元素为0,为0的元素表示两个子序列不相似;
(14)计算每个子序列si的相似子序列个数:将所有子序列的集合作为初始处理集So,剔除所有与si相关系数为0的子序列;剔除So中与当前子序列si平凡匹配的子序列;将So中将与当前子序列si距离最近的子序列smi作为候选加入si的相似集Ss中,并将smi从So中剔除;剔除So中与smi平凡匹配的子序列;递归处理子序列So,直到So中子序列为空;记录子序列si的相似子序列的位置以及总个数;
(15)提取K-模体:提取相似子序列总数前k多的子序列及其相似子序列,相似子序列最多的子序列及其相似子序列构成1-模体,相似子序列第二多的子序列及其相似子序列构成2-模体,依次类推。
3.根据权利要求1所述的基于频繁项挖掘的多维时间序列同步模体发现方法,其特征在于,所述步骤(2)包括以下步骤:
(21)使用四元组[d,k,t,l]描述所有的单维模体实例mi,其中,d表示该模体实例所属的维度;k表示属于该d维度中第k重要的模体;t描述该模体实例在原始时间序列中的开始位置;l描述该模体实例的标识,标识中包括所在维度信息以及所在的模体信息,标识的格式为:“M”+两位维度标识+两位模体标识;若维数和模体数量更加,可以扩展编码位数;对模体实例分配标识后,同一维度同一模体中的所有模体实例的标识都相同;
(22)基于预先定义的时间阈值td,将满足阈值条件的不同维度的单维模体实例置入同一个同步模体实例集SI中;对于两个不同维度的模体实例[d1,k1,t1,l1]和[d2,k2,t2,l2],如果满足条件|t1-t2|<td,则这两个模体实例属于同步模体实例;多个互相同步的模体实例构成一个同步模体实例集,在同一个同步模体实例集中任意两个实例之间的时间距离小于td;其中td取值为模体实例长度w的百分比,用户根据业务领域需求设置。
4.根据权利要求1所述的基于频繁项挖掘的多维时间序列同步模体发现方法,其特征在于,所述步骤(4)包括以下步骤:
(41)产生频繁项集和候选项集时,项集内部按照项所在的维度顺序对项进行排序,假设i<j,则第i维的项放置第j维的项前面;频繁项集的支持度minsup>=2;
(42)对T中所有事务中的项进行计数,去掉支持度小于minsup的项,所有支持度不小于minsup的项组成频繁1项集的集合F1;
(43)采用F1*F1产生候选2项集,即将F1中任意两个非同一个维度的项进行组合,产生候选2项集集合CF2;
(44)采用Fk-1*Fk-1的方式利用k-1频繁项集产生候选k项集(k>3);合并两个k-1频繁项产生候选k项集,合并的两个k-1频繁项满足:这两个k-1频繁项的前k-2个项相同且第k-1项不属于同一个维度的;
(45)统计候选项集集CFk中k项集的支持度计数,剔除CFk中支持度计数小于minsup的k项集,剩下的k项集构成频繁k项集集合Fk;针对事务ti,产生事务项的所有k项集集合;对CFk中的任一k项集,若该k项集在当前事务ti产生的k项集集合中,则该k项集支持度计数增加1,循环处理完所有事务;
5.根据权利要求1所述的基于频繁项挖掘的多维时间序列同步模体发现方法,其特征在于,步骤(5)所述输出多维模体的具体操作为:根据挖掘出的频繁项集到同步模体实例集中检索对应的模体实例;若同步模体实例集包含该频繁项集的所有项,则输出频繁项集中项对应的模体实例。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111214295.9A CN114004286B (zh) | 2021-10-19 | 2021-10-19 | 一种基于频繁项挖掘的多维时间序列同步模体发现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111214295.9A CN114004286B (zh) | 2021-10-19 | 2021-10-19 | 一种基于频繁项挖掘的多维时间序列同步模体发现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114004286A true CN114004286A (zh) | 2022-02-01 |
CN114004286B CN114004286B (zh) | 2024-04-26 |
Family
ID=79923240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111214295.9A Active CN114004286B (zh) | 2021-10-19 | 2021-10-19 | 一种基于频繁项挖掘的多维时间序列同步模体发现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114004286B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105677837A (zh) * | 2016-01-05 | 2016-06-15 | 中国科学院深圳先进技术研究院 | 一种关联规则的挖掘方法和关联规则的挖掘装置 |
CN107291877A (zh) * | 2017-06-19 | 2017-10-24 | 西安电子科技大学 | 一种基于Apriori算法的频繁项集挖掘方法 |
CN110222090A (zh) * | 2019-06-03 | 2019-09-10 | 哈尔滨工业大学(威海) | 一种海量数据频繁项集挖掘方法 |
-
2021
- 2021-10-19 CN CN202111214295.9A patent/CN114004286B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105677837A (zh) * | 2016-01-05 | 2016-06-15 | 中国科学院深圳先进技术研究院 | 一种关联规则的挖掘方法和关联规则的挖掘装置 |
CN107291877A (zh) * | 2017-06-19 | 2017-10-24 | 西安电子科技大学 | 一种基于Apriori算法的频繁项集挖掘方法 |
CN110222090A (zh) * | 2019-06-03 | 2019-09-10 | 哈尔滨工业大学(威海) | 一种海量数据频繁项集挖掘方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114004286B (zh) | 2024-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li | An improved DBSCAN algorithm based on the neighbor similarity and fast nearest neighbor query | |
Wang et al. | Experimental comparison of representation methods and distance measures for time series data | |
Zhang et al. | Treepi: A novel graph indexing method | |
Lee et al. | Mining spatial association rules in image databases | |
Wang | A fast exact k-nearest neighbors algorithm for high dimensional search using k-means clustering and triangle inequality | |
Elbatta et al. | A dynamic method for discovering density varied clusters | |
CN110598061A (zh) | 一种多元图融合的异构信息网嵌入方法 | |
CN111625574A (zh) | 一种基于布尔矩阵约简的关联规则挖掘算法 | |
Wu et al. | $ K $-Ary Tree Hashing for Fast Graph Classification | |
Jouili et al. | Graph matching based on node signatures | |
KR20060025225A (ko) | 멀티미디어 데이터베이스내에서 계층적 비트맵 색인을기반으로 한 고차원 벡터 집합에서의 데이터 인덱싱 및유사 벡터 검색 방법 | |
Chakravarthy et al. | DB-Subdue: Database approach to graph mining | |
Chiu et al. | Incremental mining of closed inter-transaction itemsets over data stream sliding windows | |
CN114004286B (zh) | 一种基于频繁项挖掘的多维时间序列同步模体发现方法 | |
Hacid et al. | Incremental neighborhood graphs construction for multidimensional databases indexing | |
Hamedanian et al. | An efficient prefix tree for incremental frequent pattern mining | |
Jiang et al. | A hybrid clustering algorithm | |
Shiqiu et al. | DBSCAN clustering algorithm based on locality sensitive hashing | |
Yin et al. | An efficient clustering algorithm for mixed type attributes in large dataset | |
Yang et al. | Subsequence search considering duration and relations of events in time interval-based events sequences | |
Garcia et al. | Efficient algorithms based on relational queries to mine frequent graphs | |
Alnaji et al. | A novel clustering algorithm using k-means (CUK) | |
Itkar et al. | An efficient and optimised frequent pattern mining using novel multipath-graph structure | |
Ceglar et al. | CURIO: A fast outlier and outlier cluster detection algorithm for large datasets | |
Goswami et al. | Categorical data clustering based on an alternative data representation technique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |