CN101266578A - 基于增量式闭合序列挖掘的高速缓存数据预取方法 - Google Patents

基于增量式闭合序列挖掘的高速缓存数据预取方法 Download PDF

Info

Publication number
CN101266578A
CN101266578A CNA2008100598541A CN200810059854A CN101266578A CN 101266578 A CN101266578 A CN 101266578A CN A2008100598541 A CNA2008100598541 A CN A2008100598541A CN 200810059854 A CN200810059854 A CN 200810059854A CN 101266578 A CN101266578 A CN 101266578A
Authority
CN
China
Prior art keywords
sequence
frequent
pparent
close sequence
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008100598541A
Other languages
English (en)
Inventor
陈刚
蔡铭
李山亭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CNA2008100598541A priority Critical patent/CN101266578A/zh
Publication of CN101266578A publication Critical patent/CN101266578A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于增量式闭合序列挖掘的高速缓存数据预取方法。通过收集中央处理器访问内存的数据存取序列,转换为序列输入数据库,采用增量式闭合序列挖掘算法挖掘频繁闭合序列,提取出高速缓存数据预取规则,用于指导高速缓存的数据预取,从而使数据块之间具有语义联系,数据预取智能化,提高了高速缓存的命中率。本发明能根据实时环境的变化,增量式的对输入序列进行挖掘。无需维护大量候选闭合序列,从而节省大量运行空间。提高了高速缓存的命中率有了12%-25%的提高。本发明具有普适性,易于广泛应用于序列输入串数据库是动态更新的,变化幅度小,频率高的实时环境中。

Description

基于增量式闭合序列挖掘的高速缓存数据预取方法
技术领域
本发明涉及高速缓存数据预取技术,尤其是涉及一种基于增量式闭合序列挖掘的高速缓存数据预取方法。
背景技术
近年来,为了减少处理器等待读取数据的时间,提出了使用高速缓存的技术。采用高速缓存的系统芯片的相关部分如图1所示,该系统芯片包括处理器、高速缓存、高速缓存预取模块、内存,系统总线。其中处理器从高速缓存中读取数据并进行计算以及向高速缓存预取模块发送预取数据的控制信息;高速缓存中保存的是处理器将要使用的数据;高速缓存预取模块用于从系统内存读取处理器即将使用的数据,并将数据传输到高速缓存;内存中保存着各种数据;系统芯片总线连接所述高数缓存预取模块和内存,并传递各种控制信息。
为提高高速缓存的效率(提高命中率),在高速缓存未命中发生之前,需要高速缓存预取模块进行数据预加载(pre-load)(或预取(pre-fetch)),即把将要使用的数据预先填充到高速缓存中。存在几种公知的数据预取技术。一种是顺序预取,即预取地址空间的下一顺序行。另一种是分支预测技术,使用分支目标缓存器,当一个高速缓存行被引用时,它的相关联的分支目标地址是预取的良好候选者。
这些公知的数据预取技术,都采用简单的预取模式,高速缓存的命中率不高,预取没有利用数据块之间的语义联系,不具有智能性。因此,在高数缓存预取模块中引入语义模式,充分挖掘数据块之间的语义联系,提高高速缓存的命中率是十分有必要的。
序列模式挖掘是数据挖掘中的一项重要任务.其目的是在给定的序列数据库中挖掘出所有的满足最小支持度要求的频繁序列,以产生相应的规则或模式.这类模式有着广泛的应用,如分析顾客的购物习惯、Web页面的访问顺序、DNA序列等等。而频繁闭合序列拥有与完全频繁序列集相同的表达能力,却有着更加简洁的形式和少得多的数量,充分减少了结果集的冗余度。
将闭合序列挖掘引入高速缓存的数据预取模块中,通过对存储数据存取系列挖掘出相应的频繁闭合序列,产生数据预取的规则,从而使得数据块之间具有语义联系,数据预取智能化,这是有实际意义的。UIUC的Zhenmin等使用闭合序列模式挖掘算法Clospan的变种CMiner挖掘存储系统的数据存取序列的数据相关性,明显地提高了I/O平均响应时间。CMiner挖掘方法是针对静态数据库进行的,不能针对实时的环境进行挖掘,而存储数据的存取序列是动态更新的,特点是变化幅度小,频率高,因此需要一种更加高效的实时闭合序此列挖掘方法来满足需求。
发明内容
本发明的目的在于提供一种基于增量式闭合序列挖掘的高速缓存数据预取方法。
本发明解决其技术问题所采用的技术方案是:
1、用于存储系统的高速缓存数据预取模块中的数据预取步骤中的,通过采集CPU向内存请求的数据存取序列,将其转换为序列输入数据库,采用增量式闭合序列挖掘算法挖掘频繁闭合序列,提取出高速缓存数据预取规则,用于指导高速缓存的数据预取,提高高速缓存的命中率;
(1)采集CPU访问内存存取序列:实时记录CPU请求访问的文件系统中的逻辑块号组成的序列,每一个文件系统的逻辑块号为序列中的一个项目;
(2)预处理:处理步骤(1)得到的CPU访问内存存取序列,将步骤(1)得到的CPU访问内存存取序列划分为固定长度的序列,此序列为一个窗口,此序列长度为窗口大小,一个窗口作为一条输入序列,存入输入序列数据库中;
(3)训练:对步骤(2)得到的序列输入数据库采用增量式的闭合序列挖掘方法进行挖掘得到频繁闭合序列集合,每当步骤(2)有新的输入序列时,在已有的闭合序列挖掘的结果基础上,结合新增输入序列,增量式挖掘新的频繁闭合序列模式集合;
(4)规则生成:对步骤(3)得到的频繁闭合序列进行分解得到所蕴含的所有规则,并通过规则评估函数对规则进行评估,去除不符合要求的规则,最后得到高效的用于高速缓存数据预取的指导规则。
2.步骤(2)设置一个计数器,初始值为零,步骤(1)每采集一个项目,计数器增加1,当计数器值等于窗口大小时,把步骤(1)采集得到的序列作为一条记录存入序列输入数据库中,并清除步骤(1)的记录。计数器重置为0,取下一条存入序列输入数据库的记录,如此循环下去;
3.步骤(3)对步骤(2)得到的序列输入数据库,简称为SDB采用增量式的闭合序列挖掘方法进行挖掘得到频繁闭合序列集合的具体步骤如下:
(A)设置最小支持阈值的初始值,最小支持阈值简称为min_sup,TreeOld为空,TreeNew为空。TreeOld和TreeNew为闭合序列树,TreeOld为上一次挖掘的闭合序列树,TreeNew存储本次挖掘结果的闭合序列树,闭合序列树是一课多叉树,树节点ni是三元组<项目ii,支持值supi,子节点列表>,代表了构成某个闭合序列前缀的一个项目;ii表示对应的项目,当支持值supi>0则代表一个闭合序列的结尾项目,supi表示相应的支持值,对应的闭合序列为从根节点到此节点的路径;每个节点都有一个以项目值为索引的哈希表指向其孩子节点,n0=<ε,-1,...>表示根节点;
(B)计算SDB基于min_sup,长度为1的频繁序列,记为1-sequence;
(C)计算步骤(B)得到的1-sequence的伪投影数据库,一个1-sequence记为f1,其伪投影数据库记为SDBf1
(D)如果步骤(B)得到的所有的1-sequence都处理完了,结束,否则取步骤(B)得到的一个未处理的f1,判断此时TreeOld是否有效,如果有效并且f1仅被旧输入串数据库所包含,不被新增输入串所包含,继续执行,否则执行步骤(F);
(E)如果以f1为路径的节点在TreeOld中存在,将该节点从TreeOld中摘下,加入到TreeNew中,把该f1标记为已处理,返回步骤(D);
(F)使用频繁闭合序列挖掘算法Bide中的BackScan算法考察f1是否被其他已经挖掘的序列所包含,如果不包含,继续执行,如果包含了,无需冗余挖掘,把f1标记为已处理,返回步骤(D);
(G)创建新的闭合序列树节点Pnode,Pnode.i=f1,Pnode.supi=-1,这里的“=”是计算机程序设计中的赋值符号,使用Bide算法中的backward extension check方法计算f1的BEI值;
(H)此时记f1为Sp,记SDBf1为Sp_SDB,记Pnode为pparent,记treenew为pparent_parent。pparent表示上次迭代的树节点,pparent_parent表示更上一次迭代的树节点;
(I)计算Sp_SDB基于min_sup的本地频繁项集合,记为LFI;
(J)计算LFI中本地频繁项中支持度等于Sp支持度的个数,记为FEI;
(K)如果LFI中所有的本地频繁项都已经处理过了,执行步骤(P),否则取LFI中的一个未处理的本地频繁项Li,将Sp和Li连接,记为Sp_i,计算Sp_i的对于Sp_SDB的伪投影数据库,记为SDBSp_i
(L)判断此时TreeOld是否有效,如果有效并且Sp_i仅被旧输入串数据库所包含,不被新增输入串所包含,继续执行,否则执行步骤(N);
(M)如果以Sp_i为路径的节点在TreeOld中存在,将该节点从TreeOld中摘下,加入到pparent中。把Sp_i对应本地频繁项Li标记未处理过,返回步骤(K);
(N)使用频繁闭合序列挖掘算法Bide中的BackScan算法考察Sp_i是否有其他序列包含它,如果不包含,继续执行,如果包含了,无需冗余挖掘,把Sp_i对应本地频繁项Li标记未处理过,返回步骤(K);
(O)创建新的闭合序列树节点Pnodenew,Pnodenew.i=Sp_i,使用Bide算法中的backward extension check方法计算Sp_i的BEI值。令Sp的值等于Sp_i,Sp_SDB的值等于SDBSp_i,pparent_parent的值等于pparent,pparent的值等于Pnodenew,返回步骤(I);
(P)如果BEI和FEI都为零并且pparent的孩子节点非空,说明pparent是频繁闭合序列的一个项目,令pparent.supi=Sp的支持值,把pparent加到pparent_parent节点下。返回步骤(D);
4.步骤(4)对步骤(3)得到的频繁闭合序列进行分解得到所蕴含的所有规则,当规则评估函数值大于最小可信值时,此规则为有效规则,用于指导高速缓存数据预取。
本发明是一种基于增量式闭合序列挖掘的高速缓存数据预取方法,相对于已有的CMiner挖掘存储系统闭合序列挖掘方法,具有的明显的特点和优点在于:
能根据实时环境的变化,增量式的对输入序列进行挖掘。无需维护大量候选闭合序列,从而节省大量运行空间。提高了高速缓存的命中率有了12%-25%的提高。本发明具有普适性,易于广泛应用于序列输入串数据库是动态更新的,变化幅度小,频率高的实时环境中。
附图说明
图1是高速缓存预取模块在系统中的位置示意图。
图2是本发明的流程示意图。
图3是增量式频繁闭合序列挖掘CPU访问内存存取序列的流程示意图。
图4是实施例所生成的闭合序列树图。
具体实施方式
本发明的处理流程参见图2所示,是应用于图1中的高速缓存数据预取模块中的数据预取步骤中的。首先通过采集CPU向内存请求的数据存取序列,将其转换为序列输入数据库,然后采用增量式闭合序列挖掘算法挖掘频繁闭合序列,提取出高速缓存数据预取规则,最后用于指导高速缓存的数据预取,从而提高了高速缓存的命中率。下面结合图2介绍本发明的处理流程:
1.采集:实时记录CPU请求访问的文件系统中的逻辑块号(例如FAT32为扇区所组成的簇)组成的序列,每一个文件系统的逻辑块号为序列中的一个项目;例如实时采集到的CPU  访问内存存取序列为{CAABCABCBDCABCEABBCA}。
2.预处理:设置窗口大小为5,对图2中“采集”得到的CPU访问内存存取序列,划分为一个个大小为5的窗口,并存入输入序列数据库中,此时输入序列数据库中有四条记录,为{CAABC},{ABCBD},{CABCE},{ABBCA}。
3.训练:对图2中“预处理”得到的序列输入数据库采用增量式的闭合序列挖掘方法进行挖掘得到频繁闭合序列集合。每当图2中“预处理”有新的输入序列时,在已有的闭合序列挖掘的结果基础上,结合新增输入序列,增量式挖掘新的频繁闭合序列模式集合。下面结合图3具体介绍图2中的“训练”,具体步骤如下:
(A)设置min_sup(最小支持阈值)的初始值为2,TreeOld为空,TreeNew为空。TreeOld和TreeNew均为一棵闭合序列树,TreeOld为上一次挖掘的闭合序列树,TreeNew存储本次挖掘结果的闭合序列树。闭合序列树是一课多叉树,树节点ni是三元组<项目ii,支持值supi,子节点列表>,代表了构成某个闭合序列前缀的一个项目;ii表示对应的项目,当支持值supi>0则代表一个闭合序列的结尾项目,supi表示相应的支持值,对应的闭合序列为从根节点到此节点的路径;每个节点都有一个以项目值为索引的哈希表指向其孩子节点,n0=<ε,-1,...>表示根节点;如图4为一棵闭合序列树,图中的树节点n2,项目为A,支持值为2,由于此树节点的支持值大于零,从根节点到n2的路径为n0n1n2,则对应的闭合序列为AA。
(B)计算SDB基于min_sup,长度为1的频繁序列(1-sequence)。1-sequence为{A,B,C}。
(C)计算步骤(B)得到的1-sequence的伪投影数据库,一个1-sequence记为f1,其伪投影数据库记为SDBf1
(D)包含(D1)和(D2)两个步骤,
(D1)如果步骤(B)得到的所有的1-sequence都处理完了,结束,否则执行(D2)。
(D2)取步骤(B)得到的一个未处理的f1,判断此时TreeOld是否有效,如果有效并且f1仅被旧输入串数据库所包含,不被新增输入串所包含,继续执行,否则执行步骤(F)。
(E)如果以f1为路径的节点在TreeOld中存在,将该节点从TreeOld中摘下,加入到TreeNew中。把该f1标记为已处理,返回步骤(D)。
(F)使用频繁闭合序列挖掘算法Bide中的BackScan算法考察f1是否被其他已经挖掘的序列所包含,如果不包含,继续执行,如果包含了,无需冗余挖掘,把f1标记为已处理,返回步骤(D)。
(G)创建新的闭合序列树节点Pnode,Pnode.i=f1,Pnode.supi=-1,使用Bide算法中的backward extension check方法计算f1的BEI值。
(H)此时记f1为Sp,记SDBf1为Sp_SDB,记Pnode为pparent,记treenew为pparent_parent。pparent表示上次迭代的树节点,pparent_parent表示更上一次迭代的树节点。
(A)计算Sp_SDB基于min_sup的本地频繁项集合,记为LFI。
(B)计算LFI中本地频繁项中支持度等于Sp支持度的个数,记为FEI。
(C)包含(K1)和(K2)两个步骤,
(K1)如果LFI中所有的本地频繁项都已经处理过了,执行步骤(P),否则执行(K2)。
(K2)取LFI中的一个未处理的本地频繁项Li,将Sp和Li连接,记为Sp_i,计算Sp_i的对于Sp_SDB的伪投影数据库,记为SDBSp_i
(D)判断此时TreeOld是否有效,如果有效并且Sp_i仅被旧输入串数据库所包含,不被新增输入串所包含,继续执行,否则执行步骤(N)。
(E)如果以Sp_i为路径的节点在TreeOld中存在,将该节点从TreeOld中摘下,加入到pparent中。把Sp_i对应本地频繁项Li标记未处理过,返回步骤(K)。
(F)使用频繁闭合序列挖掘算法Bide中的BackScan算法考察Sp_i是否有其他序列包含它,如果不包含,继续执行,如果包含了,无需冗余挖掘,把Sp_i对应本地频繁项Li标记未处理过,返回步骤(K)。
(G)创建新的闭合序列树节点Pnodenew,Pnodenew.i=Sp_i,使用Bide算法中的backward extension check方法计算Sp_i的BEI值。令Sp的值等于Sp_i,Sp_SDB的值等于SDBSp_i,pparent_parent的值等于pparent,pparent的值等于Pnodenew,返回步骤(I)。
(H)如果BEI和FEI都为零并且pparent的孩子节点非空,说明pparent是频繁闭合序列的一个项目,令pparent.supi=Sp的支持值,把pparent加到pparent_parent节点下。返回步骤(D)。
经过上述步骤(A)到步骤(P)的计算之后,可得闭合序列树如图4所示。由图4可知频繁闭合序列集合为{AA:2,ABB:2,ABC:4,CA:3,CABC:2,CB:3}
4.规则生成:对图2中“训练”得到的频繁闭合序列进行分解得到所蕴含的所有规则,并通过规则评估函数对规则进行评估,去除不符合要求的规则,最后得到高效的用于高速缓存数据预取的指导规则。对于ABC频繁闭合序列,分解为如下规则{A→B,A→C,B→C,AB→C}。对于A→B规则,其规则评估函数为sup(B)/sup(A),其中sup(A)表示序列A的支持度为4,sup(B)表示序列B的支持度也为4,则sup(B)/sup(A)的值为100%。设置最小可信值为60%,则规则A→B评估函数的值大于最小可信值,规则为有效规则,可用于指导高速缓存数据预取。
总之,本发明的试验实施的实施例是成功的,实现了发明目的。

Claims (4)

1.一种基于增量式闭合序列挖掘的高速缓存数据预取方法,其特征在于:是用于存储系统的高速缓存数据预取模块中的数据预取步骤中的,通过采集CPU向内存请求的数据存取序列,将其转换为序列输入数据库,采用增量式闭合序列挖掘算法挖掘频繁闭合序列,提取出高速缓存数据预取规则,用于指导高速缓存的数据预取,提高高速缓存的命中率;
(1)采集CPU访问内存存取序列:实时记录CPU请求访问的文件系统中的逻辑块号组成的序列,每一个文件系统的逻辑块号为序列中的一个项目;
(2)预处理:处理步骤(1)得到的CPU访问内存存取序列,将步骤(1)得到的CPU访问内存存取序列划分为固定长度的序列,此序列为一个窗口,此序列长度为窗口大小,一个窗口作为一条输入序列,存入输入序列数据库中;
(3)训练:对步骤(2)得到的序列输入数据库采用增量式的闭合序列挖掘方法进行挖掘得到频繁闭合序列集合,每当步骤(2)有新的输入序列时,在已有的闭合序列挖掘的结果基础上,结合新增输入序列,增量式挖掘新的频繁闭合序列模式集合;
(4)规则生成:对步骤(3)得到的频繁闭合序列进行分解得到所蕴含的所有规则,并通过规则评估函数对规则进行评估,去除不符合要求的规则,最后得到高效的用于高速缓存数据预取的指导规则。
2.根据权利要求1所述的一种基于增量式闭合序列挖掘的高速缓存数据预取方法,其特征在于:步骤(2)设置一个计数器,初始值为零,步骤(1)每采集一个项目,计数器增加1,当计数器值等于窗口大小时,把步骤(1)采集得到的序列作为一条记录存入序列输入数据库中,并清除步骤(1)的记录,计数器重置为0,取下一条存入序列输入数据库的记录,如此循环下去;
3.根据权利要求1所述的一种基于增量式闭合序列挖掘的高速缓存数据预取方法,其特征在于:步骤(3)对步骤(2)得到的序列输入数据库,简称为SDB采用增量式的闭合序列挖掘方法进行挖掘得到频繁闭合序列集合的具体步骤如下:
(A)设置最小支持阈值的初始值,最小支持阈值简称为min_sup,设置TreeOld为空,TreeNew为空,TreeOld和TreeNew均为一棵闭合序列树,TreeOld为上一次挖掘的闭合序列树,TreeNew存储本次挖掘结果的闭合序列树;
(B)计算SDB基于min_sup,长度为1的频繁序列,记为1-sequence;
(C)计算步骤(B)得到的1-sequence的伪投影数据库,一个1-sequence记为f1,其伪投影数据库记为SDBf1
(D)如果步骤(B)得到的所有的1-sequence都处理完了,结束,否则取步骤(B)得到的一个未处理的f1,判断此时TreeOld是否有效,如果有效并且f1仅被旧输入串数据库所包含,不被新增输入串所包含,继续执行,否则执行步骤(F);
(E)如果以f1为路径的节点在TreeOld中存在,将该节点从TreeOld中摘下,加入到TreeNew中,把该f1标记为已处理,返回步骤(D);
(F)使用频繁闭合序列挖掘算法Bide中的BackScan算法考察f1是否被其他已经挖掘的序列所包含,如果不包含,继续执行,如果包含了,无需冗余挖掘,把f1标记为已处理,返回步骤(D);
(G)创建新的闭合序列树节点Pnode,Pnode.i=f1,Pnode.supi=-1,这里的“=”是计算机程序设计中的赋值符号,使用Bide算法中的backward extension check方法计算f1的BEI值;
(H)此时记f1为Sp,记SDBf1为Sp_SDB,记Pnode为pparent,记treenew为pparent_parent,pparent表示上次迭代的树节点,pparent_parent表示更上一次迭代的树节点;
(I)计算Sp_SDB基于min_sup的本地频繁项集合,记为LFI;
(J)计算LFI中本地频繁项中支持度等于Sp支持度的个数,记为FEI;
(K)如果LFI中所有的本地频繁项都已经处理过了,执行步骤(P),否则取LFI中的一个未处理的本地频繁项Li,将Sp和Li连接,记为Sp_i,计算Sp_i的对于Sp_SDB的伪投影数据库,记为SDBSp_i
(L)判断此时TreeOld是否有效,如果有效并且Sp_i仅被旧输入串数据库所包含,不被新增输入串所包含,继续执行,否则执行步骤(N);
(M)如果以Sp_i为路径的节点在TreeOld中存在,将该节点从TreeOld中摘下,加入到pparent中,把Sp_i对应本地频繁项Li标记未处理过,返回步骤(K);
(N)使用频繁闭合序列挖掘算法Bide中的BackScan算法考察Sp_i是否有其他序列包含它,如果不包含,继续执行,如果包含了,无需冗余挖掘,把Sp_i对应本地频繁项Li标记未处理过,返回步骤(K);
(O)创建新的闭合序列树节点Pnodenew,Pnodenew.i=Sp_i,使用Bide算法中的backward extension check方法计算Sp_i的BEI值,令Sp的值等于Sp_i,Sp_SDB的值等于SDBSp_i,pparent_parent的值等于pparent,pparent的值等于Pnodenew,返回步骤(I);
(P)如果BEI和FEI都为零并且pparent的孩子节点非空,说明pparent是频繁闭合序列的一个项目,令pparent.supi=Sp的支持值,把pparent加到pparent_parent节点下,返回步骤(D);
4.根据权利要求1所述的一种基于增量式闭合序列挖掘的高速缓存数据预取方法,其特征在于:步骤(4)对步骤(3)得到的频繁闭合序列进行分解得到所蕴含的所有规则,当规则评估函数值大于最小可信值时,此规则为有效规则,用于指导高速缓存数据预取。
CNA2008100598541A 2008-02-22 2008-02-22 基于增量式闭合序列挖掘的高速缓存数据预取方法 Pending CN101266578A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2008100598541A CN101266578A (zh) 2008-02-22 2008-02-22 基于增量式闭合序列挖掘的高速缓存数据预取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2008100598541A CN101266578A (zh) 2008-02-22 2008-02-22 基于增量式闭合序列挖掘的高速缓存数据预取方法

Publications (1)

Publication Number Publication Date
CN101266578A true CN101266578A (zh) 2008-09-17

Family

ID=39989003

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008100598541A Pending CN101266578A (zh) 2008-02-22 2008-02-22 基于增量式闭合序列挖掘的高速缓存数据预取方法

Country Status (1)

Country Link
CN (1) CN101266578A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101944101A (zh) * 2010-07-14 2011-01-12 北京北大众志微系统科技有限责任公司 一种文件预取动态定量指示方法及装置
CN102098175A (zh) * 2011-01-26 2011-06-15 浪潮通信信息系统有限公司 一种移动互联网告警关联规则获取方法
CN102142992A (zh) * 2011-01-11 2011-08-03 浪潮通信信息系统有限公司 通信告警频繁项集挖掘引擎及冗余处理方法
CN101630291B (zh) * 2009-08-03 2012-11-14 中国科学院计算技术研究所 虚拟存储系统和方法
CN103885832A (zh) * 2012-12-20 2014-06-25 华为技术有限公司 一种资源分配方法、设备和系统
CN107423234A (zh) * 2016-04-18 2017-12-01 联发科技股份有限公司 多处理器系统及缓存共享方法
WO2018090255A1 (zh) * 2016-11-16 2018-05-24 华为技术有限公司 内存访问技术
CN109491985A (zh) * 2018-10-10 2019-03-19 北京中盾安全技术开发公司 一种基于关联规则的热数据处理方法和装置
CN109545283A (zh) * 2018-11-23 2019-03-29 西安交通大学 一种基于序列模式挖掘算法的系统发生树构建方法
WO2019127487A1 (zh) * 2017-12-29 2019-07-04 华为技术有限公司 一种数据预取方法、装置和存储设备
US10437820B2 (en) 2015-08-06 2019-10-08 Red Hat, Inc. Asymmetric distributed cache with data chains
CN114065947A (zh) * 2021-11-15 2022-02-18 深圳大学 一种数据访问推测方法、装置、存储介质及电子设备

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630291B (zh) * 2009-08-03 2012-11-14 中国科学院计算技术研究所 虚拟存储系统和方法
CN101944101B (zh) * 2010-07-14 2012-07-25 北京北大众志微系统科技有限责任公司 一种文件预取动态定量指示方法及装置
CN101944101A (zh) * 2010-07-14 2011-01-12 北京北大众志微系统科技有限责任公司 一种文件预取动态定量指示方法及装置
CN102142992A (zh) * 2011-01-11 2011-08-03 浪潮通信信息系统有限公司 通信告警频繁项集挖掘引擎及冗余处理方法
CN102098175A (zh) * 2011-01-26 2011-06-15 浪潮通信信息系统有限公司 一种移动互联网告警关联规则获取方法
CN102098175B (zh) * 2011-01-26 2015-07-01 浪潮通信信息系统有限公司 一种移动互联网告警关联规则获取方法
CN103885832A (zh) * 2012-12-20 2014-06-25 华为技术有限公司 一种资源分配方法、设备和系统
CN103885832B (zh) * 2012-12-20 2018-07-03 华为技术有限公司 一种资源分配方法、设备和系统
US10437820B2 (en) 2015-08-06 2019-10-08 Red Hat, Inc. Asymmetric distributed cache with data chains
CN107423234A (zh) * 2016-04-18 2017-12-01 联发科技股份有限公司 多处理器系统及缓存共享方法
WO2018090255A1 (zh) * 2016-11-16 2018-05-24 华为技术有限公司 内存访问技术
US11210020B2 (en) 2016-11-16 2021-12-28 Huawei Technologies Co., Ltd. Methods and systems for accessing a memory
WO2019127487A1 (zh) * 2017-12-29 2019-07-04 华为技术有限公司 一种数据预取方法、装置和存储设备
US11099997B2 (en) 2017-12-29 2021-08-24 Huawei Technologies Co., Ltd. Data prefetching method and apparatus, and storage device
CN109491985A (zh) * 2018-10-10 2019-03-19 北京中盾安全技术开发公司 一种基于关联规则的热数据处理方法和装置
CN109545283A (zh) * 2018-11-23 2019-03-29 西安交通大学 一种基于序列模式挖掘算法的系统发生树构建方法
CN109545283B (zh) * 2018-11-23 2020-11-10 西安交通大学 一种基于序列模式挖掘算法的系统发生树构建方法
CN114065947A (zh) * 2021-11-15 2022-02-18 深圳大学 一种数据访问推测方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN101266578A (zh) 基于增量式闭合序列挖掘的高速缓存数据预取方法
CN102521269B (zh) 一种基于索引的计算机连续数据保护方法
US8392403B2 (en) Management of data and computation in data centers
CN101937448B (zh) 用于主存储器列存储装置的基于字典的保持顺序的串压缩
CN101630291B (zh) 虚拟存储系统和方法
CN102289507B (zh) 一种基于滑动窗口的数据流加权频繁模式挖掘方法
CN102306183B (zh) 一种对事务数据流进行闭合加权频繁模式挖掘的方法
CN103810244A (zh) 一种基于数据分布的分布式数据存储系统的扩容方法
CN105975587A (zh) 一种高性能的内存数据库索引组织与访问方法
CN104809182A (zh) 基于动态可分裂Bloom Filter的网络爬虫URL去重方法
CN103559259A (zh) 基于云平台的消除近似重复网页方法
JP2016026353A (ja) データベース及びデータベースからのデータ評価方法
CN103294822A (zh) 一种基于主动哈希和布隆过滤器的高效缓存方法
CN110569245A (zh) 重复数据删除系统中基于强化学习的指纹索引预取方法
JP2013228999A (ja) データベース処理装置、方法、プログラム及びデータ構造
Kucukyilmaz et al. A machine learning approach for result caching in web search engines
Carniel et al. A generic and efficient framework for flash-aware spatial indexing
Cheng et al. ETKDS: An efficient algorithm of Top-K high utility itemsets mining over data streams under sliding window model
CN107562806A (zh) 混合内存文件系统的自适应感知加速方法及系统
CN106844541A (zh) 一种联机分析处理方法及装置
CN117194502A (zh) 一种基于长短期记忆网络的数据库内容缓存替换方法
Yang et al. Incremental Mining of Across-streams Sequential Patterns in Multiple Data Streams.
CN102902735A (zh) 一种交互式网络电视iptv搜索缓存方法和系统
CN103353864B (zh) 一种数据库近似字典规则的挖掘方法、系统及数据库终端
Sutha et al. Mining frequent, maximal and closed frequent itemsets over data stream-a review

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080917