CN102254034A - 一种基于bide的olap查询日志挖掘及推荐方法 - Google Patents

一种基于bide的olap查询日志挖掘及推荐方法 Download PDF

Info

Publication number
CN102254034A
CN102254034A CN201110226191XA CN201110226191A CN102254034A CN 102254034 A CN102254034 A CN 102254034A CN 201110226191X A CN201110226191X A CN 201110226191XA CN 201110226191 A CN201110226191 A CN 201110226191A CN 102254034 A CN102254034 A CN 102254034A
Authority
CN
China
Prior art keywords
query
inquiry
olap
pattern
bide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201110226191XA
Other languages
English (en)
Inventor
张鲁杭
陈岭
肖敏
殷婷
胡黎玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Hongcheng Computer Systems Co Ltd
Original Assignee
Zhejiang Hongcheng Computer Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Hongcheng Computer Systems Co Ltd filed Critical Zhejiang Hongcheng Computer Systems Co Ltd
Priority to CN201110226191XA priority Critical patent/CN102254034A/zh
Publication of CN102254034A publication Critical patent/CN102254034A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及OLAP推荐技术,特别涉及一种基于BIDE的OLAP查询日志挖掘及推荐方法,该方法将可能的下一步查询推荐给OLAP用户,简化用户浏览分析多维数据的过程。本发明的有益效果:抓住OLAP领域查询操作的特点,提取日志文件中表示OLAP操作的字段,将日志文件抽象成查询序列,简化了日志文件的表示方法;利用BIDE算法在查询序列中挖掘查询模式,在保证不降低推荐准确率的前提下,提高了后续推荐的效率;通过在查询模式上建立后缀树,使得后续模式匹配无需采用搜索算法查找查询匹配的起点,提高了模式匹配的速度;提出模糊查询模式匹配算法,提高了推荐的准确度。

Description

一种基于BIDE的OLAP查询日志挖掘及推荐方法
技术领域
本发明涉及OLAP推荐技术,特别涉及一种基于BIDE的OLAP查询日志挖掘及推荐方法。
背景技术
联机分析处理(Online Analytical Processing,OLAP)支持分析人员和决策者从多个角度对数据进行快速、一致、交互地访问。在OLAP系统中,用户可以透过多维视图,使用上卷、下钻、旋转、切片、切块等操作,从多个角度自主地进行数据分析和知识发现,从而对数据更深入了解。但是,通过OLAP操作浏览多维数据的过程非常繁琐,用户往往无法确定下一步如何操作,不断尝试无效查询操作,降低了实现业务分析目标的效率。
为了提高用户面对海量信息的快速反应力,将推荐技术引入OLAP领域。然而传统的推荐技术不能直接用于OLAP领域,究其原因,主要在于传统推荐方法推荐的是一个结果,而OLAP推荐的是用户一个查询目标中的下一步分析操作。
发明内容
本发明为克服现有技术中存在的不足之处,目的在于提供一种基于BIDE的OLAP查询日志挖掘及推荐方法,该方法将可能的下一步查询推荐给OLAP用户,简化用户浏览分析多维数据的过程,解决了现有技术中存在的问题。
本发明是通过以下技术方案达到上述目的:一种基于BIDE的OLAP查询日志挖掘及推荐方法,包括以下步骤:
1)根据OLAP服务器日志文件中的历史查询语句划分查询会话:首先,判断本条查询语句是否是最顶层的查询语句,然后通过判断后一条查询语句是否是在前一条查询语句的基础上连续上卷若干层以内形成的,作为判断前后两条查询语句是否属于同一个查询会话的标志,若是,则将本条查询语句加入当前查询会话中,若否,将本条查询语句作为新查询会话的第一条查询语句,开始划分为一个新的查询会话,从而划分查询会话;
2)通过对查询会话中前后两条查询语句的比较,用不同的标志来记录OLAP的基本操作顺序,从而在查询会话中生成查询序列;
3)在生成的查询序列中运用BIDE算法,挖掘连续的查询模式,得到历史查询模式;
4)通过将每一个查询模式,及其它的所有子查询插入到树型结构中的办法,来建立查询后缀树,使得这棵查询后缀树包含了查询模式所有可能的子查询模式;
5)根据用户的当前查询序列,运用AQPM算法,在查询后缀树中寻找匹配当前查询序列的历史查询模式,预测用户的下一步查询;
6)按照概率大小对候选查询排序,选择前五个查询推荐给用户。
作为优选,步骤1所述的通过判断后一条查询语句是否是在前一条查询语句的基础上连续上卷若干层以内形成的,作为判断前后两条查询语句是否属于同一个查询会话的标志,所述的若干层为5层。
作为优选,步骤6)所述的按照概率大小对候选查询排序基于马尔科夫模型进行。
作为优选,历史查询模式和查询后缀树根据OLAP服务器日志文件的改变动态更新。
本发明的有益效果:该方法是一种新的用于OLAP中的推荐方法,与现有的推荐方法相比,其优点在于:
1)抓住OLAP领域查询操作的特点,提取日志文件中表示OLAP操作的字段,将日志文件抽象成查询序列,简化了日志文件的表示方法;
2)利用BIDE算法在查询序列中挖掘查询模式,在保证不降低推荐准确率的前提下,提高了后续推荐的效率;
3)通过在查询模式上建立后缀树,即把所有查询模式及其后缀模式索引到一颗共享前缀的树上,使得后续模式匹配无需采用搜索算法查找查询匹配的起点,提高了模式匹配的速度。
4)提出模糊查询模式匹配(Approximate Query Pattern Matching,AQPM)算法,用于在连续查询模式中寻找匹配当前查询序列的下一步查询,提高了推荐的准确度。
附图说明
图1是本发明的系统构架示意图;
图2是基于BIDE的OLAP查询日志挖掘及推荐方法流程图;
图3是AQPM算法流程图。
具体实施方式
实施例1:下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此:
本发明系统构架由数据准备部分和实时推荐两部分组成,总体的系统架构如图1所示:在该系统中,数据准备部分负责在OLAP历史查询日志中挖掘查询模式,实时推荐部分负责获取用户当前的查询序列,在查询模式中寻找匹配的模式,从而将下一步查询推荐给用户。
本发明的总流程图,如图2所示,本实施例使用MDX语法表示OLAP查询。MDX查询语言中对多维数据集的维度和层次定义有特定语法结构:对多维数据集中的维度x下的第i层次钻取,所使用的MDX查询语句遵循“[维度x].[层次1].[层次2].[层次i].children”的规范。在一个多维数据源内,每个维度的每个层次都对应于唯一且固定的“[]”串。
根据OLAP服务器日志文件中的历史查询语句划分查询会话:首先,判断本条查询语句是否是最顶层的查询语句,然后通过判断后一条查询语句是否是在前一条查询语句的基础上连续上卷5层以内形成的,作为判断前后两条查询语句是否属于同一个查询会话的标志,若是,则将本条查询语句加入当前查询会话中,若否,将本条查询语句作为新查询会话的第一条查询语句,开始划分为一个新的查询会话,从而划分查询会话;
生成查询序列的方法是通过比较前后两条查询语句中“[]”串的异同的方法,用不同的标志来记录OLAP的基本操作顺序,从而在查询会话中生成查询序列。
1)当用户进行连续上卷或者连续下钻操作时,每次查询操作的层次变化只有一层,所以每条查询语句与上一条相比,有且只有一个“[]...[].children”串不同,通过比较前后两条查询语句中“[]...[].children”串的异同,能够处理上卷,下钻操作;
2)当用户进行切片切块旋转操作时,并不影响分析粒度,即不改变上下文查询的维度及层次,因此,表示相邻两条查询语句的“[]...[].children”,串没有变化。对于切片和切块操作,可判断MDX查询语句中的where关键串后的字符串变化,在查询序列数组中置特殊数字以区分;对于旋转操作,可判断ON COLUMNS和ON ROWS关键串前的字符串是否互换,同样在查询序列数组中置特殊数字。
生成查询序列伪代码如下所示:
seqGenerate(contents)
输入:MDX语句集合contents
输出:抽象的查询序列集合seqcontents[]
1:Seqnum=-1;
2:last=null;n=null;
3:for(j=0;j<contents.length;j++){
4:n=anysis(contents[j]);
5:Set setDifference=new HashSet();
6:setDifference=Compare(n,last);
7:if(last==null||setDifference.size()>5)
8:seqcontents[++seqnum]=n;
9:else seqcontents[seqnum]+=“$”+setDifference;
10:last=n;}
11:for(j=0;j<seqcontents.length;j++){
12:filter(seqcontents[j]);
13:return seqcontents;
初始化查询序列号(第1行),初始化两个记录日志文件中前后两个查询语句含有的“[]…[].children”串的集合(第2行)。开始循环读入日志文件中的每一条查询语句(第3行),提取该查询语句中的“[]…[].children”串,将其映射为序号,添加到当前的集合中(第4行),比较前后查询集合,将不同的“[]…[].children”串添加到前后查询的差集中(第5,6行),判断是否一个新的查询会话,若是,重新开始一个查询序列,并将这个新的查询序列初始化为当前查询所含的“[]…[].children”串集合,否则,将前后查询的差集添加到当前查询序列中,并以一个特殊符号分割(第7,8,9行),将上一个查询赋值为本次查询,作为下一个查询语句的前一个查询(第10行),对查询序列集合进行查询误操作的判断(第11,12行)。
查询模式挖掘,首先接受历史查询序列作为输入,进而挖掘出查询序列模式,最后将这些序列模式组织成一颗查询后缀树。
运用BIDE算法,在历史查询序列中挖掘查询模式。BIDE是一种高效的双向查询频繁闭合序列挖掘算法。该算法采用序列闭合检查策略,并利用BackScan剪枝方法和Scan-Skip优化技术更深地修剪查询空间。BIDE算法在内存使用上,比其他频繁序列挖掘算法如colspan少了几个数量级,而在执行时间上快了一个数量级左右。
BIDE算法伪代码如下所示:
BIDE(SDB,FCS,w,n)
输入:序列数据库SDB,连续性限制上限u,最小支持度与序列数比值w,序列数n
输出:频繁闭序列集合FCS
1:
Figure BSA00000552918400061
2:F=frequent 1-sequences(SDB,w,n);
3:for(each 1-sequence f in F)do
4:SDBf=pseudoprojected_database(SDB);
5:for(each f in F)do
6:if(!BackScan(f,SDBf))
7:BEI=backward_extensioncheck(f,SDBf);
8:Call qbide(SDBf,f,BEI,FCS,w,n);
9:return FCS;
qbide(Sp_SDB,Sp,BEI,FCS,w,n)
输入:投影序列数据库Sp_SDB,前缀序列Sp,backward extension数目BEI,
最小支持度与序列数比值w,序列数n
输出:当前频繁闭序列集合FCS
10:LFI=locallyffequentitems(Sp_SDB);
11:FEI=|{in LFI|z.sup=sup(Sp)}|;
12:if((BEI+FEI)==0)
13:FCS=FCS U{Sp};
14:for(each I in LFI)do
15:Sp=<Sp,i>;
16:SDB=pseudoprojecteddatabase(Sp_SDB,Sp);
17:for(each I in LFI)do
18:if(!BackScan(Sp,SDB))
19:BEI=backward_extensioncheck(Sp,SDB);
20:call qbide(SDB,Sp,BEI,FCS,w,n);
该算法先遍历数据库一次,找到频繁一项集(第2行),对频繁一项集建立伪投影数据库(第3,4行),把每一个频繁一项集看做一个前缀,应用backScan剪枝技术判断它是否该被剪枝(第6行),如果不被剪枝,计算backward-extension-items数量(第7行),调用子程序qbide(第8行),子程序qbide递归调用自身,步骤如下:对于一个前缀S,遍历它的投影数据库S_SDB一次找到本地频繁项(第10行),计算forward-extension-items数量(第11行),如果没有backward-extension-items和forward-extension-items,则把Sp作为一个闭的频繁模式输出(第12,13行),把本地频繁项加入到S中来得到一个新的前缀(第15行),并对新的前缀建立伪投影数据库(第16行),对每一个新的前缀,首先判断它是否被剪枝(第18行),若否,计算backward-extension-items(第19行)并调用自身(第20行)。
为了加快后续查询模式匹配的速度,实时地为用户推荐下一个查询,采用索引查询模式的方法,即建立后缀树,把所有查询模式及其后缀模式索引到一颗共享前缀的树上。
后缀树是用于查询预测的特殊数据结构。通过给每一个查询模式的每一个后缀查询模式建立一条路径,使该后缀树包含了查询模式所有可能的子查询模式。树的每一个节点表示查询模式中的一步查询,树中任何一条从根到叶节点的路径是一条查询模式的一个后缀。
同时,历史查询模式和查询后缀树根据OLAP服务器日志文件的改变动态更新。
然后从OLAP服务器中获取当前查询日志文件,根据当前查询日志文件的变化,取得当前查询语句,加入到当前查询序列中。根据用户的当前查询序列,运用AQPM算法,在查询后缀树中寻找匹配当前查询序列的历史查询模式,预测用户的下一步查询。其中模式匹配是根据用户当前的查询序列,在后缀树中选择候选查询模式。AQPM算法的基本思想是模糊匹配,即选择一条查询序列模式,其前缀与用户当前查询序列最相似。查询模式匹配过程通过在后缀树中查找与当前查询序列匹配的子树来确定候选查询模式子集。但在现实情况中,初始输入的当前查询序列不一定能在预测树中找到与之完全对应的子树,分析其原因,可能有以下几种:
1)用户当前的查询序列可能包含一些并不代表其查询目的的误操作;
2)后缀树中是历史查询模式,即历史查询序列的抽象,即允许跳过元素个数满足连续性的查询序列,而当前查询序列是查询的一个具体事例;
3)用户当前查询包含过时查询。
根据以上三种不能完全匹配的情况,采取以下三种处理方法:
1)在查询匹配之前,对用户当前的查询序列进行去除噪声处理。起初噪声处理过滤掉下钻一层又马上上卷一层这样的查询,例如查询序列:{1,3,4,2,5,2,8}就包含了上述情况,噪声处理后的查询序列为{1,3,4,2,8};
2)在满足连续性[0,u]限制范围内跳过查询不匹配的那些查询,继续在后缀树中查找候选模式,u为预定义的连续性的上界;
3)循环截断当前查询序列中时间点最久远的查询。
AQPM算法步骤,如图3所示:
1)对当前查询进行去噪声处理;
2)判断是否找到匹配,若是,则匹配成功,返回匹配节点,程序结束。
3)否则开始序号加1,重新匹配;
4)判断开始序号是否等于序列长度,若是,则匹配不成功,返回根节点,程序结束。
5)否则取出查询序列的下一个查询;
6)判断是否到达查询序列末尾,若是转到步骤2);
7)若否,则判断是否找到该查询,若找到则转到步骤5),循环匹配下一个查询;
8)如果找不到该查询,判断丢弃节点的个数是否满足连续性条件,若否,则跳转到步骤2);
9)如果满足连续性条件,则取出下一个查询;
10)判断是否能找到该查询,若是,跳转到步骤5),若否,跳转到步骤8),循环丢弃查询。
在获得候选查询模式后,即可基于马尔科夫模型进行查询推荐。
假设当前查询序列(q1,q2,q3,...,qk),则其下一步有效查询q’的概率可由下列公式计算得出:
(q’,q1,q2,q3,...qk)=P(q’|q1,q2,q3,...qk)·P(q1,q2,q3,...qk)    (1)
由于用户当前的查询操作是确定的,所以上式可以简化为:
(q’, q1,q2,q3,...qk)=P(q’|q1,q2,q3,...qk)    (2)
查询推荐中的概率矩阵由用户当前查询操作和候选查询模式集合决定。假设P为符合预测的候选序列模式的集合,共有j个,可得 P ( q &prime; , q ) = P ( q &prime; | q ) = &Sigma; i = 1 j P ( q &prime; | q , P i ) . 则其下一步有
效查询操作的概率矩阵M(q,P)可表示为:
M ( q , P ) = P ( q 1 | q , P 1 ) P ( q 2 | q , P 1 ) . . . P ( q i | q , P 1 ) P ( q 1 | q , P 2 ) P ( q 2 | q , P 2 ) . . . P ( q i | q , P 2 ) . . . . . . . . . . . . P ( q 1 | q , P J ) P ( q 2 | q , P J ) . . . P ( q i | q , P J ) - - - ( 3 )
上述概率矩阵可简化为如下形式:
M ( q , P ) = [ &Sigma; k = 1 l P ( q 1 | q , P k ) &Sigma; k = 1 j P ( q 2 | q , P k ) &CenterDot; &CenterDot; &CenterDot; &Sigma; k = 1 l P ( q i | q , P k ) ] = [ N q , q 1 N q N q , q 2 N q . . . N q , q i N q ] - - - ( 4 )
其中
Figure BSA00000552918400104
是在候选序列模式中包含从查询操作q到qi的支持度,Nq是在候选序列模式中包含从查询操作q到其它所有操作的支持度。
根据以上概率矩阵的计算结果,将各可能的下一步有效查询按概率由大到小排序,并映射到对应的“[]…[].children”串中,从而将可能的下一步有效查询操作推荐给用户。其中:
1)以上一步的预测结果作为输入,即查询后缀树中的一个最佳匹配序列的查询结点;
2)按照概率大小对该查询的所有子结点排序;
3)概率最大的作为第一推荐,推荐给用户;概率前五的作为候选推荐,推荐给用户。
以上的所述乃是本发明的具体实施例及所运用的技术原理,若依本发明的构想所作的改变,其所产生的功能作用仍未超出说明书及附图所涵盖的精神时,仍应属本发明的保护范围。

Claims (4)

1.一种基于BIDE的OLAP查询日志挖掘及推荐方法,其特征在于包括以下步骤:1)根据OLAP服务器日志文件中的历史查询语句划分查询会话:首先,判断本条查询语句是否是最顶层的查询语句,然后通过判断后一条查询语句是否是在前一条查询语句的基础上连续上卷若干层以内形成的,作为判断前后两条查询语句是否属于同一个查询会话的标志,若是,则将本条查询语句加入当前查询会话中,若否,将本条查询语句作为新查询会话的第一条查询语句,开始划分为一个新的查询会话,从而划分查询会话;
2)通过对查询会话中前后两条查询语句的比较,用不同的标志来记录OLAP的基本操作顺序,从而在查询会话中生成查询序列;
3)在生成的查询序列中运用BIDE算法,挖掘连续的查询模式,得到历史查询模式;
4)通过将每一个查询模式,及其它的所有子查询插入到树型结构中的办法,来建立查询后缀树,使得这棵查询后缀树包含了查询模式所有可能的子查询模式;
5)根据用户的当前查询序列,运用AQPM算法,在查询后缀树中寻找匹配当前查询序列的历史查询模式,预测用户的下一步查询;
6)按照概率大小对候选查询排序,选择前五个查询推荐给用户。
2.根据权利要求1所述的一种基于BIDE的OLAP查询日志挖掘及推荐方法,其特征在于,步骤1所述的通过判断后一条查询语句是否是在前一条查询语句的基础上连续上卷若干层以内形成的,作为判断前后两条查询语句是否属于同一个查询会话的标志,所述的若干层为5层。
3.根据权利要求1所述的一种基于BIDE的OLAP查询日志挖掘及推荐方法,其特征在于,步骤6)所述的按照概率大小对候选查询排序基于马尔科夫模型进行。
4.根据权利要求1-3任一权利要求所述的一种基于BIDE的OLAP查询日志挖掘及推荐方法,其特征在于,历史查询模式和查询后缀树根据OLAP服务器日志文件的改变动态更新。
CN201110226191XA 2011-08-08 2011-08-08 一种基于bide的olap查询日志挖掘及推荐方法 Pending CN102254034A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110226191XA CN102254034A (zh) 2011-08-08 2011-08-08 一种基于bide的olap查询日志挖掘及推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110226191XA CN102254034A (zh) 2011-08-08 2011-08-08 一种基于bide的olap查询日志挖掘及推荐方法

Publications (1)

Publication Number Publication Date
CN102254034A true CN102254034A (zh) 2011-11-23

Family

ID=44981298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110226191XA Pending CN102254034A (zh) 2011-08-08 2011-08-08 一种基于bide的olap查询日志挖掘及推荐方法

Country Status (1)

Country Link
CN (1) CN102254034A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537025A (zh) * 2014-12-19 2015-04-22 北京邮电大学 频繁序列挖掘方法
CN105229633A (zh) * 2013-03-13 2016-01-06 萨勒斯福斯通讯有限公司 用于实现数据上传、处理和预测查询api公开的系统、方法和装置
CN106067039A (zh) * 2016-05-30 2016-11-02 桂林电子科技大学 基于决策树剪枝的模式匹配方法
CN107193456A (zh) * 2017-05-08 2017-09-22 上海交通大学 基于滑动式交互操作的推荐系统及方法
WO2019127743A1 (zh) * 2017-12-29 2019-07-04 上海跬智信息技术有限公司 一种基于olap预计算模型的预校验方法及预校验系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
《Proceedings of the 20th International Conference on Data Engineering (ICDE'04)》 20041231 Jianyong Wang,Jiawei Han BIDE: Efficient Mining of Frequent Closed Sequences 1-12 1-4 , *
JIANYONG WANG,JIAWEI HAN: "BIDE: Efficient Mining of Frequent Closed Sequences", 《PROCEEDINGS OF THE 20TH INTERNATIONAL CONFERENCE ON DATA ENGINEERING (ICDE’04)》 *
陈元中: "基于数据挖掘的OLAP智能查询推荐技术研究", 《中国优秀硕士学位论文全文数据库》 *
陈元中: "基于聚类的OLAP多维分析查询推荐方法研究", 《计算机工程与设计》 *
陈岭,陈元中,陈根才: "基于操作序列挖掘的OLAP查询推荐方法", 《东南大学学报(自然科学版)》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105229633A (zh) * 2013-03-13 2016-01-06 萨勒斯福斯通讯有限公司 用于实现数据上传、处理和预测查询api公开的系统、方法和装置
CN105229633B (zh) * 2013-03-13 2019-06-28 萨勒斯福斯通讯有限公司 用于实现数据上传、处理和预测查询api公开的系统、方法和装置
CN104537025A (zh) * 2014-12-19 2015-04-22 北京邮电大学 频繁序列挖掘方法
CN104537025B (zh) * 2014-12-19 2017-10-10 北京邮电大学 频繁序列挖掘方法
CN106067039A (zh) * 2016-05-30 2016-11-02 桂林电子科技大学 基于决策树剪枝的模式匹配方法
CN106067039B (zh) * 2016-05-30 2019-01-29 桂林电子科技大学 基于决策树剪枝的模式匹配方法
CN107193456A (zh) * 2017-05-08 2017-09-22 上海交通大学 基于滑动式交互操作的推荐系统及方法
CN107193456B (zh) * 2017-05-08 2018-05-08 上海交通大学 基于滑动式交互操作的推荐系统及方法
WO2019127743A1 (zh) * 2017-12-29 2019-07-04 上海跬智信息技术有限公司 一种基于olap预计算模型的预校验方法及预校验系统

Similar Documents

Publication Publication Date Title
Papadakis et al. Three-dimensional entity resolution with JedAI
Khoussainova et al. A case for a collaborative query management system
Idreos et al. Overview of data exploration techniques
Aligon et al. A collaborative filtering approach for recommending OLAP sessions
Gu et al. Multimodal representation for neural code search
Khoussainova et al. SnipSuggest: Context-aware autocompletion for SQL
CN100476806C (zh) 概念网络
Lin et al. A fast algorithm for mining fuzzy frequent itemsets
CN112948547B (zh) 测井知识图谱构建查询方法、装置、设备及存储介质
Sun et al. On link-based similarity join
CN102254034A (zh) 一种基于bide的olap查询日志挖掘及推荐方法
Battle et al. A structured review of data management technology for interactive visualization and analysis
CN107291877A (zh) 一种基于Apriori算法的频繁项集挖掘方法
Vanahalli et al. An efficient parallel row enumerated algorithm for mining frequent colossal closed itemsets from high dimensional datasets
Fiot et al. From crispness to fuzziness: Three algorithms for soft sequential pattern mining
Shraga et al. Explaining dataset changes for semantic data versioning with explain-da-v
CN112667286B (zh) 一种基于编程现场环境上下文的搜索方法
Yang et al. Application of Apriori and FP-growth algorithms in soft examination data analysis
Ansari et al. TFI-Apriori: Using new encoding to optimize the apriori algorithm
Skhiri et al. Large graph mining: recent developments, challenges and potential solutions
CN108932350A (zh) 基于多策略的水稻病虫害智能问答方法
Redyuk et al. DORIAN in action: assisted design of data science pipelines
Azabou et al. Diamond multidimensional model and aggregation operators for document OLAP
Guo et al. Distributed processing of regular path queries in RDF graphs
Rangaswamy et al. ‘Optimized Association Rule Mining using Genetic Algorithm

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111123

DD01 Delivery of document by public notice

Addressee: Wang Tianhui

Document name: Notification that Application Deemed not to be Proposed

DD01 Delivery of document by public notice