CN104408294B - 一种基于事件关系网络的事件摘要方法 - Google Patents
一种基于事件关系网络的事件摘要方法 Download PDFInfo
- Publication number
- CN104408294B CN104408294B CN201410607163.6A CN201410607163A CN104408294B CN 104408294 B CN104408294 B CN 104408294B CN 201410607163 A CN201410607163 A CN 201410607163A CN 104408294 B CN104408294 B CN 104408294B
- Authority
- CN
- China
- Prior art keywords
- event
- sequence
- histogram
- type
- events
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000012634 fragment Substances 0.000 claims abstract description 24
- 230000014509 gene expression Effects 0.000 claims abstract description 5
- 230000008569 process Effects 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 5
- 230000000737 periodic effect Effects 0.000 claims description 2
- 108010071644 fragmentin Proteins 0.000 claims 1
- 230000007812 deficiency Effects 0.000 abstract description 3
- 238000005065 mining Methods 0.000 description 6
- 238000007726 management method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000007418 data mining Methods 0.000 description 3
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 2
- 238000009412 basement excavation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于事件关系网络的事件摘要方法,包括以下步骤:步骤1,选取有序事件序列中任意两个事件类型作为关注事件类型,根据关注事件类型构造一个子事件序列,并构造该子事件序列的到达间隔直方图;步骤2,基于最短描述长度原则编码子事件序列中的片段;步骤3,基于启发式算法对子事件序列中的片段进行划分,计算子事件序列的最短编码长度;步骤4,构造事件关系网络刻画事件模式。本发明提供的方法依据最短描述长度原则对事件到达间隔直方图及其近似直方图进行编码,表达方式直观、易于理解,克服了需要事先确定组数和频数的不足,并能识别不相交的直方图集合。
Description
技术领域
本发明属于数据挖掘领域,特别是一种基于事件关系网络图的事件摘要方法。
背景技术
事件摘要是数据挖掘领域事件挖掘方向相对新的研究热点之一,可以被视为是频繁项集挖掘和频繁场景挖掘的扩展。频繁模式挖掘技术通过识别离散时间之间的相关性,能揭示一些令人感兴趣的模式,往往可以作为事件摘要的构造块。
许多系统和应用程序会产生大量的时序事件,即关联着时间戳的事件序列,例如:系统日志、HTTP请求序列、数据库请求序列和网络流量数据序列等。这些事件捕获了随着时间变化而不断改变的系统状态和行为,对于历史事件数据的挖掘是理解和优化系统行为的有效方式之一。通过审核挖掘得到的事件模式,系统管理员可以建立事件或事故管理规则以消除或者缓解系统失效风险。目前,这种方式已经成为大规模分布式系统管理的标准方法,被IBM和HP这样的IT公司应用于IT基础设施管理。
现有的大部分事件挖掘研究工作都致力于场景挖掘或频繁模式发现(R.Agrawaland R.Srikant.Mining sequential patterns.In ICDE,1995;S.Laxman andK.P.Unnikrishnan P.S.Sastryand.Discovering frequent episodes and learninghidden markov models:A formal connection.IEEE Transactions on Knowledge andData Engineering,17:1505-1517,2005;T.Li,F.Liang,S.Ma,and W.Peng.An integratedframework on mining logs files for computing system management.In KDD,2005.)。这些方法简单地产生相互独立的大量模式,而不能提供一种简要的和综合性的事件摘要以揭示数据集所蕴含的系统视图,且这些模式对于系统管理员而言难于获得将它们应用于降低系统运行风险的方法。
最新的事件挖掘研究工作不在聚焦于频繁模式发现,转而关注事件摘要。通常的方法是将事件序列划分为不相交的事件片段,而后为每一个事件片段产生一个事件模式用于描述片段中的事件。Peng提出了一种事件摘要方法,该方法从通过分析事件日志进而度量事件达到获取模式(W.Peng,C.Perng,T.Li,and H.Wang.Event summarization forsystem management.In KDD,2008.);Kiernan将事件摘要建模成优化问题,主要目的是平衡摘要的准确性和局部模型的缺陷,为此提出了一种基于分片的事件摘要方法,该方法将事件序列按照事件出现的频率变化划分为若干个事件片段(J.Kiernan andE.Terzi.Constructing comprehensive summaries of large event sequences.ACMTransactions on Knowledge Discovery from Data,3:1–31,2009)。基于上述工作,Peng进一步地提出了采用隐马尔科夫模型来刻画事件序列片段之间的状态迁移过程,改进基于分片的事件摘要方法(W.Peng,H.Wang,M.Liu,and W.Wang.An algorithmic approach toevent summarization.In SIGMOD,2010.)。然而,这些方法获得的事件摘要对于数据挖掘领域的外行而言难于理解,无法为系统管理员提供足够的帮助。
本发明中采用直方图的方式描述事件模式,并采用信息论中的位串方式对直方图进行编码。Marsland提出了一种直方图的编码方法(S.Marsland,C.J.Twining,andC.J.Taylor.A minimum description length objective function for group-wisenon-rigid image registration.In Image and Vision Computing,2008),但该方法仅适用于有固定的组数和固定的频数的直方图,而本发明中用于事件摘要的直方图不能满足上述要求,所以不能应用于本发明。
发明内容
为克服现有技术的不足,本发明中依据最短描述长度原则对事件到达间隔直方图及其近似直方图进行编码,克服了需要事先确定组数和频数的不足,并能识别不相交的直方图集合。进一步地,采用事件网络关系模型这一直观和易于理解的表达方式表示事件模式,能帮助系统管理员掌握系统运行状态及其变化过程。
一种基于事件关系网络的事件摘要方法,包括以下步骤:
步骤1,构造事件到达间隔直方图,过程如下:
给定一个事件序列D,令S是D中最多包含两种不同事件类型ex和ey的子序列,且子序列S可以划分为k个不相交的片段,即S=(S1,S2,...,Sp,...,Sk),1≤p≤k;对于任意的片段Sp,根据片段Sp中事件类型为ex和ey的事件到达时间间隔分布情况,构造事件到达间隔直方图,记为hxy(Sp);
步骤2,基于最短描述长度原则编码事件片段,过程如下:
给定仅包含事件类型ex和ey的子序列S,对于任意的子序列S中事件片段Sp,先编码近似直方图编码长度再编码与hxy(Sp)的距离,编码长度最后计算事件到达间隔直方图编码长度,
步骤3,基于启发式算法的最佳事件片段划分,过程如下:
给定事件序列D中仅包含事件类型ex和ey的子序列S,构造子序列S对应的直方图图采用最短路径算法Dijkastra查找直方图图的最短路径,路径上的k个不相交片段即为子序列Sl一个最佳划分使得子序列Sl的编码长度最短,然后按照步骤2计算S的每个划分对应的近似直方图表示事件片段蕴含的事件模式,并将该事件模式添加到事件模式集R;
步骤4,构造事件关系网络刻画事件模式,过程如下:
定义事件关系网络ERN=(V',E'),其中顶点集V'表示事件模式集R中涉及到的所有事件类型集E'表示事件类型之间的关系;遍历事件模式集R,将每一个事件模式表示成ERN的一条边,并将事件模式的参数作为边的权重;遍历完成后产生完整的事件关系网络。
本发明与现有技术相比具有显著优点:(1)可以捕获同类型事件和两种不同类型事件之间的时序关系;(2)采用最短描述长度原则平衡摘要的准确性和简洁性;(3)以事件关系网络刻画事件序列蕴含的事件模式,使得系统管理员易于理解;
下面结合附图对本发明作进一步详细描述。
附图说明
图1基于事件关系网络的事件摘要方法;
图2事件到达间隔直方图示例;
图3事件片段的编码过程;
图4基于启发式算法的最佳事件片段划分过程。
具体实施方式
结合图1,阐述一种基于事件关系网络的事件摘要方法,包括以下步骤:
步骤1,选取有序事件序列中任意两个事件类型作为关注事件类型,根据关注事件类型构造一个子事件序列,并构造该子事件序列的到达间隔直方图,过程如下:
步骤1.1,给定一个由n个有序事件构成的事件序列D=(<t1,e1>,...,<ti,ej>,..,<tn,em>),其中,<ti,ej>,1≤i≤n,1≤j≤m表示第i个事件,ti表示第i个事件发生的时间戳,ej∈ε={e1,e2,...,em}表示事件类型,ε表示事件类型的集合。
步骤1.2,获取事件序列D中仅包含事件类型ex和ey的子事件序列S,1≤x,y≤m。
步骤1.3,将子事件序列S划分为k个不相交的片段S=(S1,S2,...,Sp,...,Sk)。
步骤1.4,记录下列参数:序列S每一个片段Sp中类型为ex的事件到达的时间戳序列S每一个片段Sp中类型为ex的事件到达后首次出现类型为ey的事件的时间戳到达间隔值bp、非空组binp的个数和非空组binp频数nump,如图2所示。
步骤1.5,利用公式①构造片段Sp的事件到达间隔直方图hxy(Sp)
①
步骤2,基于最短描述长度原则编码子事件序列中的片段,给定仅包含事件类型ex和ey的子序列S,事件摘要问题本质就是查找该事件序列的k个不相交片段的一个最佳划分S=(S1,S2,...,Sp,...,Sk),并为任意的事件片段Sp构造一个最佳的近似直方图作为Sp的事件到达间隔直方图的近似,从而使得子序列S的编码长度最短,结合图3,具体过程如下:
步骤2.1,编码到达间隔直方图hxy(Sp)的近似直方图给定Sp及其对应的事件到达间隔直方图hxy(Sp),采用表示对hxy(Sp)的近似,两者具有相同的事件到达频数,但非空组数不同,且的非空组数一般取值为1或2,小于hxy(Sp)的非空组数;编码任意的事件片段Sp对应的近似直方图需要对描述直方图的三个要素分别进行编码,这三个要素分别是:事件类型,事件片段的边界和非空的组:
步骤2.1.1,对事件片段Sp的事件类型集进行编码,长度为
步骤2.1.2,对事件片段Sp边界进行编码,长度为Bp表示事件片段Sp的边界;
步骤2.1.3,对事件片段Sp所有非空组进行编码,长度为δ表示事件片段Sp中最大的到达间隔;
步骤2.1.4,利用公式②,编码到达间隔直方图hxy(Sp)的近似直方图
②
步骤2.2,编码与hxy(Sp)的距离表示两直方图间的距离定义为需要移动的频数之和:
步骤2.2.1,获取hxy(Sp)的非空组数设的非空组数为
步骤2.2.2,遍历记录非空组bin'p,若中不存在到达间隔值bp的组,则若中存在到达间隔值bp的组,则
步骤2.3,计算事件到达间隔直方图hxy(Sp)的编码长度, 其中表示事件到达间隔直方图hxy(Sp)的所有可能的近似直方图的全集,需要从中查找最小的一个作为hxy(Sp)的近似,计算方法如下:
步骤2.3.1,按照非空组binp的频数nump大小,以降序方式对hxy(Sp)中的所有非空组进行排序;
步骤2.3.2,初始化topn=1;
步骤2.3.2,取hxy(Sp)的前topn个非空组binp,采用步骤2.1的方法构造近似直方图,每个非空组binp的频数等于得到计算出
步骤2.3.3,取前topn+1个组构造近似直方图,采用与步骤2.3.2相同的方式计算出新的Lnew(hxy(Sp)),若Lnew(hxy(Sp))大于步骤2.3.2中的L(hxy(Sp)),则满足最短编码长度原则的近似直方图计算结束;否则,topn=topn+1,跳转到步骤2.3.2,直到
步骤3,基于启发式算法的最佳事件片段划分,给定事件序列D中仅包含事件类型ex和ey的事件子序列Sl,事件摘要问题本质就是查找该事件序列的k个不相交片段的一个最佳划分从而使事件子序列Sl的编码长度最短,即步骤如下:
步骤3.1,获取事件序列D中仅包含一种事件类型的m个子序列,其中m为事件类型的总个数,m=|ε|;获取事件序列D中包含两种事件类型的m2-m个子序列,将m2个子序列构成集合SubD;对于任意一个子序列Sl,l∈[1,m2]中的事件片段Sl∈SubD,采用五元组刻画事件片段中蕴含的事件模式,其中和分别表示该模式所刻画的事件序列的开始时间戳和结束时间戳,ex和ey是事件模式关注的事件类型,wp是一个周期性参数,表示事件类型为ex和ey的事件到达间隔长度。若ex=ey,则该事件模式为周期性模式,采用事件到达间隔直方图的近似表示周期性模式;否则为相关性模式,采用事件到达间隔直方图的近似表示相关性模式;
步骤3.2,初始化事件序列D蕴含的事件模式集
步骤3.3,构造子序列Sl对应的有向直方图图其中Vl是顶点集,El是边集;顶点集的大小其中是子序列中事件类型ex和ey的事件之间的到达间隔的总个数;采用事件类型为ex的事件在子序列S的位置信息作为顶点名,用于区分不同顶点。对于任意的两个顶点和 若以顶点为起点,以顶点为终点构成事件片段按照公式②计算事件片段的事件到达间隔直方图的编码长度作为这条边的权值,添加一条边到边集El;
步骤3.4,采用最短路径算法Dijkastra查找直方图图上从第一顶点到第顶点的所有路径中的最短路径 1<v1<vw<vz<Cxy,子序列的最佳事件片段划分为Sl={<v1,v2>,<v2,v3>,...,<vw,v(w+1)>,....,<vz,Cxy>},简记为其中k=|Sl|;
步骤3.5,按照步骤2.3计算任意的子序列Sl的每个划分对应的近似直方图表示事件片段蕴含的事件模式,并将该事件模式添加到事件模式集R;
步骤3.6,SubD=SubD-{Sl},若SubD≠φ,转到步骤3.3,对任意的新子序列进行步骤3.3至步骤3.5的计算过程;否则结束步骤3。
步骤4,构造事件关系网络刻画事件模式,事件关系网络是一种基于图的模型,是能准确地并以易于理解的方式表达事件模式的有效方法,具体步骤为:
步骤4.1,定义事件关系网络可为ERN=(V',E'),其中顶点集V'表示事件模式集R中涉及到的所有事件类型集E'表示事件类型之间的关系,对于任意的两个顶点ex'∈V'和ey'∈V',边其中w表示边的权值;具体的构造过程如下:
步骤4.1,定义事件关系网络可为ERN=(V',E'),其中顶点集V'表示事件模式集R中涉及到的所有事件类型集E'表示事件类型之间的关系,对于任意的两个顶点ex'∈V'和ey'∈V',边其中w表示边的权值;
步骤4.2,识别事件模式集R中涉及到的所有事件类型集ε',使得V'=ε';
步骤4.3,遍历事件模式集R,对于任意的事件模式ep∈R,若ep仅包含事件类型ex∈V',则ep是周期性模式,添加边到边集E',其中ep.wp表示事件模式ep中事件重复出现的周期值;若ep包含事件类型ex,ey∈V',且ex≠ey,则ep是相关性模式,添加边到边集E',其中ep.wp表示事件模式ep中事件类型为ex的事件出现后事件类型为ey的事件的到达间隔;
步骤4.4 R=R-{ep},若则结束,否则跳转到步骤4.3。
Claims (4)
1.一种基于事件关系网络的事件摘要方法,其特征在于,包括以下步骤:
步骤1,选取有序事件序列中任意两个事件类型作为关注事件类型,根据关注事件类型构造一个子事件序列,并构造该子事件序列的到达间隔直方图;
步骤2,基于最短描述长度原则编码子事件序列中的片段;
步骤3,基于启发式算法对子事件序列中的片段进行划分,计算子事件序列的最短编码长度;
步骤4,构造事件关系网络刻画事件模式;
步骤1的直方图具体构造过程如下:
步骤1.1,给定一个由n个有序事件构成的事件序列D=(<t1,e1>,...,<ti,ej>,..,<tn,em>),其中,<ti,ej>,1≤i≤n,1≤j≤m表示第i个事件,ti表示第i个事件发生的时间戳,ej∈ε={e1,e2,...,em}表示事件类型,ε表示事件类型的集合;
步骤1.2,获取事件序列D中仅包含事件类型ex和ey的子事件序列S,1≤x,y≤m;
步骤1.3,将子事件序列S划分为k个不相交的片段S=(S1,S2,...,Sp,...,Sk);
步骤1.4,记录下列参数:序列S每一个片段Sp中类型为ex的事件到达的时间戳序列S每一个片段Sp中类型为ex的事件到达后首次出现类型为ey的事件的时间戳到达间隔值bp、非空组binp的个数和非空组binp频数nump;
步骤1.5,利用公式①构造片段Sp的事件到达间隔直方图hxy(Sp)
步骤2的具体过程为:
步骤2.1,编码到达间隔直方图hxy(Sp)的近似直方图
步骤2.2,编码与hxy(Sp)的距离
步骤2.3,计算事件到达间隔直方图hxy(Sp)的编码长度;
步骤3的具体步骤为:
步骤3.1,获取事件序列D中仅包含一种事件类型的m个子序列,其中m为事件类型的总个数;获取事件序列D中包含两种事件类型的m2-m个子序列,将m2个子序列构成集合SubD;对于任意一个子序列Sl,l∈[1,m2]中的事件片段Sl∈SubD,采用五元组刻画事件片段中蕴含的事件模式,其中和 分别表示该模式所刻画的事件序列的开始时间戳和结束时间戳,wp表示事件类型为ex和ey的事件到达间隔长度;
步骤3.2,初始化事件序列D蕴含的事件模式集
步骤3.3,构造子序列Sl对应的有向直方图图其中Vl是顶点集,El是边集;顶点集的大小其中是子序列中事件类型ex和ey的事件之间的到达间隔的总个数;对于任意的两个顶点和 以顶点 为起点,以顶点为终点构成事件片段按照公式②计算事件片段的事件到达间隔直方图的编码长度作为这条边的权值,添加一条边 到边集El;
步骤3.4,采用最短路径算法Dijkastra查找直方图图上从第一顶点到第 顶点的所有路径中的最短路径 则子序列的最佳事件片段划分为Sl={<v1,v2>,<v2,v3>,...,<vw,v(w+1)>,....,<vz,Cxy>};
步骤3.5,按照步骤2.3计算任意的子序列Sl的每个划分对应的近似直方图表示事件片段蕴含的事件模式,并将该事件模式添加到事件模式集R;
步骤3.6,SubD=SubD-{Sl},若SubD≠φ,转到步骤3.3,对任意的新子序列进行步骤3.3至步骤3.5的计算过程;否则结束步骤3;
步骤4的具体步骤为:
步骤4.1,定义事件关系网络可为ERN=(V′,E′),其中顶点集V′表示事件模式 集R中涉及到的所有事件类型集E′表示事件类型之间的关系,对于任意的两个顶点ex′∈V′和ey′∈V′,边其中w表示边的权值;
步骤4.2,识别事件模式集R中涉及到的所有事件类型集ε′,使得V′=ε′;
步骤4.3,遍历事件模式集R,对于任意的事件模式ep∈R,若ep仅包含事件类型ex∈V′,则ep是周期性模式,添加边到边集E′,其中ep.wp表示事件模式ep中事件重复出现的周期值;若ep包含事件类型ex,ey∈V′,且ex≠ey,则ep是相关性模式,添加边到边集E′,其中ep.wp表示事件模式ep中事件类型为ex的事件出现后事件类型为ey的事件的到达间隔;
步骤4.4R=R-{ep},若则结束,否则跳转到步骤4.3。
2.根据权利要求1所述的基于事件关系网络的事件摘要方法,其特征在于,步骤2.1的具体方法为:
步骤2.1.1,对事件片段Sp的事件类型集进行编码,长度为
步骤2.1.2,对事件片段Sp边界进行编码,长度为Βp表示事件片段Sp的边界;
步骤2.1.3,对事件片段Sp所有非空组进行编码,长度为 δ表示事件片段Sp中最大的到达间隔;
步骤2.1.4,利用公式②,编码到达间隔直方图hxy(Sp)的近似直方图
②。
3.根据权利要求2所述的基于事件关系网络的事件摘要方法,其特征在于,步骤2.2的具体方法为:
步骤2.2.1,获取hxy(Sp)的非空组数设的非空组数为
步骤2.2.2,遍历记录非空组bin′p,若中不存在到达间隔值bp的组,则若中存在到达间隔值 bp的组,则
4.根据权利要求3所述的基于事件关系网络的事件摘要方法,其特征在于,步骤2.3的具体方法为:
步骤2.3.1,按照非空组binp的频数nump大小,以降序方式对hxy(Sp)中的所有非空组进行排序;
步骤2.3.2,初始化topn=1;
步骤2.3.3,取hxy(Sp)的前topn个非空组binp,采用步骤2.1的方法构造hxy(Sp)的前topn个非空组binp的近似直方图和计算
步骤2.3.4,取前topn+1个非空组构造近似直方图,采用与步骤2.3.3相同的方式计算出新的Lnew(hxy(Sp)),若Lnew(hxy(Sp))大于L(hxy(Sp)),则Lnew(hxy(Sp))为事件到达间隔直方图hxy(Sp)的编码长度,计算结束;否则,topn=topn+1,跳转到步骤2.3.2,直到
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410607163.6A CN104408294B (zh) | 2014-10-31 | 2014-10-31 | 一种基于事件关系网络的事件摘要方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410607163.6A CN104408294B (zh) | 2014-10-31 | 2014-10-31 | 一种基于事件关系网络的事件摘要方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104408294A CN104408294A (zh) | 2015-03-11 |
CN104408294B true CN104408294B (zh) | 2017-07-21 |
Family
ID=52645925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410607163.6A Expired - Fee Related CN104408294B (zh) | 2014-10-31 | 2014-10-31 | 一种基于事件关系网络的事件摘要方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104408294B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106127338B (zh) * | 2016-06-22 | 2020-02-04 | 南京邮电大学 | 一种交通网络不相交路径搜寻方法 |
CN106777981B (zh) * | 2016-12-16 | 2020-07-14 | Tcl科技集团股份有限公司 | 一种行为数据的校验方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005234628A (ja) * | 2004-02-17 | 2005-09-02 | Meidensha Corp | 物流管理システムおよび物流管理方法 |
CN1975720A (zh) * | 2006-12-27 | 2007-06-06 | 章毅 | 一种基于Web的数据挖掘系统及其控制方法 |
US7792843B2 (en) * | 2005-12-21 | 2010-09-07 | Adobe Systems Incorporated | Web analytics data ranking and audio presentation |
US8069374B2 (en) * | 2009-02-27 | 2011-11-29 | Microsoft Corporation | Fingerprinting event logs for system management troubleshooting |
CN103634473A (zh) * | 2013-12-05 | 2014-03-12 | 南京理工大学连云港研究院 | 基于朴素贝叶斯分类的手机垃圾短信过滤方法与系统 |
CN104021194A (zh) * | 2014-06-13 | 2014-09-03 | 浪潮(北京)电子信息产业有限公司 | 一种面向行业大数据多样性应用的混合型处理系统及处理方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014093778A1 (en) * | 2012-12-14 | 2014-06-19 | Robert Bosch Gmbh | System and method for event summarization using observer social media messages |
US9128977B2 (en) * | 2012-12-21 | 2015-09-08 | Dropbox, Inc. | Enhancing event summaries of synced online content management system interactions |
-
2014
- 2014-10-31 CN CN201410607163.6A patent/CN104408294B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005234628A (ja) * | 2004-02-17 | 2005-09-02 | Meidensha Corp | 物流管理システムおよび物流管理方法 |
US7792843B2 (en) * | 2005-12-21 | 2010-09-07 | Adobe Systems Incorporated | Web analytics data ranking and audio presentation |
CN1975720A (zh) * | 2006-12-27 | 2007-06-06 | 章毅 | 一种基于Web的数据挖掘系统及其控制方法 |
US8069374B2 (en) * | 2009-02-27 | 2011-11-29 | Microsoft Corporation | Fingerprinting event logs for system management troubleshooting |
CN103634473A (zh) * | 2013-12-05 | 2014-03-12 | 南京理工大学连云港研究院 | 基于朴素贝叶斯分类的手机垃圾短信过滤方法与系统 |
CN104021194A (zh) * | 2014-06-13 | 2014-09-03 | 浪潮(北京)电子信息产业有限公司 | 一种面向行业大数据多样性应用的混合型处理系统及处理方法 |
Non-Patent Citations (3)
Title |
---|
Event Summarization for System Management;Wei Peng等;《Proceedings of Acm Kdd》;20071231;全文 * |
基于事务序列的视频摘要挖掘方法研究;赵丕锡等;《计算机工程与应用》;20121231;第48卷(第15期);全文 * |
基于混合EHMM模型的数据流预测;丁勇等;《计算机科学》;20140630;第41卷(第6A期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN104408294A (zh) | 2015-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Potamias et al. | Sampling trajectory streams with spatiotemporal criteria | |
Elbatta et al. | A dynamic method for discovering density varied clusters | |
CN103927346B (zh) | 基于数据量的查询连接方法 | |
Chakrabort et al. | Computer science fields as ground-truth communities: Their impact, rise and fall | |
CN102768670B (zh) | 基于节点属性标签传播的网页聚类方法 | |
CN106452450A (zh) | 数据压缩 | |
CN102902826B (zh) | 一种基于基准图像索引的图像快速检索方法 | |
CN102122291A (zh) | 一种基于树形日志模式分析的博客好友推荐方法 | |
CN107491508B (zh) | 一种基于循环神经网络的数据库查询时间预测方法 | |
CN104408294B (zh) | 一种基于事件关系网络的事件摘要方法 | |
CN102521325A (zh) | 基于频繁关联标签序列的xml结构相似度度量方法 | |
CN104133857A (zh) | 一种基于配置约束的业务流程模型挖掘的新方法 | |
CN109101599A (zh) | 一种增量索引更新方法及系统 | |
Harel et al. | Complete closed time intervals-related patterns mining | |
CN102306177A (zh) | 一种多策略组合的本体或实例匹配方法 | |
CN102890719A (zh) | 一种对车牌号进行模糊搜索的方法及装置 | |
CN104156635A (zh) | 基于公共子序列的基因芯片表达数据的opsm挖掘方法 | |
Hassani et al. | I-hastream: density-based hierarchical clustering of big data streams and its application to big graph analytics tools | |
CN103020283A (zh) | 一种基于背景知识的动态重构的语义检索方法 | |
CN105025013B (zh) | 基于优先级Trie树的动态IP匹配模型的建立方法 | |
Yu et al. | Mining frequent co-occurrence patterns across multiple data streams. | |
CN110046265B (zh) | 一种基于双层索引的子图查询方法 | |
CN105653567A (zh) | 一种文本序列数据中快速查找特征字符串的方法 | |
CN107194966B (zh) | 一种二维地质断面图地质界线及其属性信息的辨识方法 | |
CN109800231A (zh) | 一种基于Flink的实时轨迹co-movement运动模式检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170721 |