CN102662642B - 一种基于嵌套滑动窗口和遗传算法的并行处理方法 - Google Patents

一种基于嵌套滑动窗口和遗传算法的并行处理方法 Download PDF

Info

Publication number
CN102662642B
CN102662642B CN201210116428.3A CN201210116428A CN102662642B CN 102662642 B CN102662642 B CN 102662642B CN 201210116428 A CN201210116428 A CN 201210116428A CN 102662642 B CN102662642 B CN 102662642B
Authority
CN
China
Prior art keywords
data
frequent item
subwindow
item set
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210116428.3A
Other languages
English (en)
Other versions
CN102662642A (zh
Inventor
卢晓伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201210116428.3A priority Critical patent/CN102662642B/zh
Publication of CN102662642A publication Critical patent/CN102662642A/zh
Application granted granted Critical
Publication of CN102662642B publication Critical patent/CN102662642B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供一种基于嵌套滑动窗口和遗传算法的并行处理方法,采用基于滑动窗口之上的嵌套子窗口模型和利用遗传算法,根据数据流数据量大需要实时处理的特点,采用GPU-CUDA并行处理技术来进行动态挖掘出最新数据的频繁项集,综合处理滑动窗口内各嵌套子窗口中频繁项集,获得当前滑动窗口内数据的频繁项集,最后采用遗传算法的并行模式,得到数据流的频繁项集模式。

Description

一种基于嵌套滑动窗口和遗传算法的并行处理方法
技术领域
本发明涉及近期数据流频繁项集挖掘的实现方法,具体地说是一种基于嵌套子窗口模型和遗传算法的近期数据流频繁项集挖掘并行处理方法,。
背景技术
数据流实际上就是连续移动的元素队伍,其中的元素是由相关数据的集合组成。令t表示任一时间戳,at表示在该时间戳到达的数据,流数据可以表示成{…,at?1,at,at+1,…}.区别于传统应用模型,流数据模型具有以下4点共性:(1)数据实时到达;(2)数据到达次序独立,不受应用系统所控制;(3)数据规模宏大且不能预知其最大值;(4)数据一经处理,除非特意保存,否则不能被再次取出处理,或者再次提取数据代价昂贵。
滑动窗口(slidingwindow)模型:滑动窗口对窗口起点和终点都没有明确给定,只明确给定窗口的长度W。窗口保持一定长度在数据流D={d0,d1…,dn}上滑动,处理的数据流范围就由该窗口确定,随着窗口的滑动不断地把得到的结果输出。滑动窗口SW的长度既可由一个时间区间确定,也可由窗口所包含数据流元素个数确定;
嵌套子窗口模型:某时刻T,窗口长度为W的滑动窗口SW内最新数据集dn落入到窗口大小为W2的嵌套子窗口S_SW中,称窗口SW为嵌套子窗口。
如图1所示,应用滑动窗口对动态更新数据集进行说明。窗口数据集为图1(a)中标识所示。当新增数据集到达时,滑动窗口向前移动一个单位,如图1(b)所示。
滑动窗口的频繁项集:对于当前滑动窗口内数据,设I={i1,i2,…,in}是项的集合,事务数据集S={s0,s1…,sn},其中,数据集中每个事务s是项的集合,s?I。如果X?s,则称X是个项集。如果X中有k个元素,则称X为k-项集。对于一个项集X,如果其支持度大于等于用户给定的最小支持度阈值,则X为频繁项集。
遗传算法:一种基于随机搜索的优化算法,已成功应用于函数优化、自动控制、生产调度、机器人学、图像处理、人工生命、机器学习和数据挖掘等领域。从代表问题可能潜在的解集的一个种群开始的,而一个种群则由经过基因编码的一定数目的个体组成。每个个体实际上是染色体带有特征的实体。染色体作为遗传物质的主要载体,即多个基因的集合,其内部表现(即基因型)是某种基因组合,它决定了个体的形状的外部表现,如黑头发的特征是由染色体中控制这一特征的某种基因组合决定的。因此,在一开始需要实现从表现型到基因型的映射即编码工作。由于仿照基因编码的工作很复杂,我们往往进行简化,如二进制编码,初代种群产生之后,按照适者生存和优胜劣汰的原理,逐代演化产生出越来越好的近似解,在每一代,根据问题域中个体的适应度大小选择个体,并借助于自然遗传学的遗传算子进行组合交叉和变异,产生出代表新的解集的种群。这个过程将导致种群像自然进化一样的后生代种群比前代更加适应于环境,末代种群中的最优个体经过解码,可以作为问题近似最优解。
遗传算法的基本运算过程如下,算法流程示意图如图2:
a)初始化:设置进化代数计数器t=0,设置最大进化代数T,随机生成M个个体作为初始群体P(0)
b)个体评价:计算群体P(t)中各个个体的适应度。
c)选择运算:将选择算子作用于群体。选择的目的是把优化的个体直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。选择操作是建立在群体中个体的适应度评估基础上的。
d)交叉运算:将交叉算子作用于群体。所谓交叉是指把两个父代个体的部分结构加以替换重组而生成新个体的操作。遗传算法中起核心作用的就是交叉算子。
e)变异运算:将变异算子作用于群体。即是对群体中的个体串的某些基因座上的基因值作变动。群体P(t)经过选择、交叉、变异运算之后得到下一代群体P(t1)
f)终止条件判断:若t=T,则以进化过程中所得到的具有最大适应度个体作为最优解输出,终止计算。
CUDA是一种并行编程模型和软件环境,采用C语言等标准编程语言进行操作。该技术封装了GPU的硬件细节,CUDA的核心有三个重要抽象概念:线程组层次结构、共享存储器、屏蔽同步(barriersynchronization)。
这些抽象提供了细粒度的数据并行化和线程并行化,嵌套于粗粒度的数据并行化和任务并行化之中,将问题分解为更小的片段,以便通过协作的方法并行解决。这样的分解保留了语言表达,允许线程在解决各子问题时协作,同时支持透明的可伸缩性。因而,该技术可以利用GPU的众核特性,大幅加速并行化的应用。
但是,目前还没有一种能快速有效地获得流数据频繁项集的技术来提高用户的操作体验。
发明内容
本发明所要解决的技术问题是需要提供一种适应流数据的流动性特点,采用遗传算法的并行形式,得到一种并行处理的理论依据和解决方法及以快速有效地获得流数据的频繁项集。
本发明的目的是按以下方式实现的:
采用基于滑动窗口之上的嵌套子窗口模型和利用遗传算法,根据数据流数据量大需要实时处理的特点,采用GPU-CUDA并行处理技术来进行动态挖掘出最新数据的频繁项集,综合处理滑动窗口内各嵌套子窗口中频繁项集,获得当前滑动窗口内数据的频繁项集,最后采用遗传算法的并行模式,得到数据流的频繁项集模式,获得当前滑动窗口内数据的频繁项集的步骤,包括:
1)滑动窗口内的数据分成Z段,将每个嵌套子窗口内的数据交给一个线程进行并行处理,获得初始种群,计算个体支持度值是初始种群内待考察频繁模式与实际事务匹配的过程,选择,交叉,变异,扫描确定变异后个体支持度值,判断结束条件;
2)获得的各个频繁项集模式与之前U(U=w1/w2-1)次获得的频繁项集模式共同组成初始种群,进行一次搜索,最终满足条件的模式个体为滑动窗口内数据的频繁项集,随着数据流的流动,继续处理新接收到的数据,并抛弃最早的数据;
3)利用遗传算法的并行性搜索嵌套子窗口内最新数据的频繁项集,从一组初始种群开始搜索过程,种群中的每个个体是一个可能的频繁模式,遗传算法通过交叉、变异、选择运算实现,经过若干代选择之后,得到最终频繁项集,其中变异操作是通过动态、随机改变个体中某些基因而产生新的个体,变异操作是产生全局最优的一个重要原因,有助于增加种群的多样性,但本算法中频繁项集产生所需的各对应非零基因都已存在,经交叉操作产生的基因基本上涵盖所有频繁项集,因此采用一个较低的变异率;
4)综合处理滑动窗口内各嵌套子窗口中频繁项集,最终获得当前滑动窗口内数据的频繁项集;
5)随着新数据的流入,周期性删除过期流数据,并重复以上两部分操作;
具体步骤如下:
1)设定滑动窗口SW及子窗口S_SW大小,分别为w1、w2输入各类参数之后,根据数据流属性来确定窗口大小,SW内容是根据当前多少条事务的频繁项集的兴趣度来决定的,子窗口是根据数据的处理能力以及被抛弃的旧数据条数来确定,也决定了需求所要求统计的频率;
2)给定支持度阈值S,若某个个体i,其适应度为Fi,当Fi>=S,事务i即为滑动窗口内数据集的频繁项集模式;
3)事务的属性种数、各属性的取值范围以及生成原始种群大小来确定最大迭代次数T,处理方法是采用子窗口模型,避免在旧数据被淘汰之后,对滑动窗口SW内存在的数据进行多次重复处理;
4)设定交叉概率P,个体变异概率Q,子窗口内的数据分成Z段并行计算,函数采用GPUCUDA并行技术,将每个子窗口内的数据交给一个线程进行并行处理;
5)获得初始种群,数据在流动过程中,获取子窗口内最新到来的数据,同时得到此数据的频繁1-项集,将频繁1-项集编码为实数串,并将频繁1-项集非零项按原来所在位置随机组合编码,共同组成嵌套子窗口内的初始种群,此种群中个体为待考察频繁项集模式;
具体过程如下:
(1)统计A、B和C的属性值为V1,V2,V3的个数分别作为第一列、第二列和第三列;
(2)大于等于阈值N的保留,并按其所对应的行进行赋值,小于N的赋值0,并去掉;
(3)将每一个非0值单独成一行,并保持其原来所在行的位置,其余位置填0;
(4)非零项按原来所在位置随机组合编码,共同组成初始种群;
(5)函数是采用GPUCUDA编程模式,采用流技术和共享存储器的优化手段,将每个属性的求解过程进行并行处理;
(6)计算个体支持度值是初始种群内待考察频繁模式与实际事务匹配的过程,当个体支持度值大于S时,将该个体模式加入当前子窗口频繁项集内,Fi=Wi/WZ,Fi为事务i的支持度,Wi为当前子窗口内具有相同属性值的事务条数,WZ为当前子窗口内事务总条数;
分Z段并行匹配,虽然增大了内存开销,但大量减少运行时间,对于数据流频繁项集挖掘具有很大意义;
(7)选择:将种群中个体按支持度值进行轮盘选择;
(8)交叉:以交叉概率P进行一次交叉;
(9)变异:个体按变异概率Q进行基本位变异;
(10)扫描确定变异后个体支持度值,新增的满足条件的个体添加到频繁项集中;
(11)判断结束条件,迭代次数小于T,转步骤3,T次迭代运算后,则终止迭代并获得当前嵌套子窗口内数据的频繁项集;
(12)随着数据流的流动,继续处理新接收到的数据,并抛弃最早的数据,转步骤S102继续以上操作,至数据流结束为止。
本发明与现有技术相比,本发明技术方案通过GPU强大的浮点计算能力和在GPU上进行编程的CUDA加速技术,处理流数据的频繁项集,可以采用遗传算法的并行形式进行建模,提升了用户操作体验。
本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
附图说明
图1是窗口数据集中的数据更新过程示意图;
图2是遗传算法流程示意图示意图;
图3是获取当前子窗口内频繁项集的流程图示意图;
图4初始种群生成示意图;
图5计算个体支持度;
图6频繁模式群形成;
图7扫描获得当前窗口最终频繁项集。
具体实施方式
参照说明书附图对本发明的方法作以下详细地说明。
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用理论模型和技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。
首先,如果不冲突,本发明实施例以及实施例中的各个特征的相互结合,均在本发明的保护范围之内。另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
利用遗传算法动态挖掘出最新数据的频繁项集,从一组初始种群开始搜索过程,种群中的每个个体是一个可能的频繁模式。遗传算法主要通过交叉、变异、选择运算实现。经过若干代选择之后,得到最终频繁项集。其中变异操作是通过动态、随机改变个体中某些基因而产生新的个体,变异操作是产生全局最优的一个重要原因,有助于增加种群的多样性,但本算法中频繁项集产生所需的各对应非零基因都已存在,经交叉操作产生的基因基本上可以涵盖所有频繁项集,因此采用一个较低的变异率。
本专利的方法分为三大部分:如图1、2所示;
1)利用遗传算法的并行性搜索嵌套子窗口内最新数据的频繁项集;
2)综合处理滑动窗口内各嵌套子窗口中频繁项集,最终获得当前滑动窗口内数据的频繁项集;
3)随着新数据的流入,周期性删除过期流数据,并重复以上两部分操作。
实施例1
利用遗传算法的并行性搜索嵌套子窗口内最新数据的频繁项集;如图3所示,本实施例主要包括如下步骤:
1)设定滑动窗口SW及子窗口S_SW大小,分别为w1、w2输入各类参数之后,根据数据流属性来确定窗口大小,SW内容是根据当前多少条事务的频繁项集的兴趣度来决定的,子窗口是根据数据的处理能力以及被抛弃的旧数据条数来确定,也决定了需求所要求统计的频率;
2)给定支持度阈值S,若某个个体i,其适应度为Fi,当Fi>=S,事务i即为滑动窗口内数据集的频繁项集模式;
3)事务的属性种数、各属性的取值范围以及生成原始种群大小来确定最大迭代次数T。本处理方法是采用子窗口模型,避免在旧数据被淘汰之后,对滑动窗口SW内存在的数据进行多次重复处理;
4)设定交叉概率P,个体变异概率Q,子窗口内的数据分成Z段并行计算。该处的函数采用GPUCUDA并行技术,将每个子窗口内的数据交给一个线程进行并行处理;
5)获得初始种群。数据在流动过程中,获取子窗口内最新到来的数据,同时得到此数据的频繁1-项集,将频繁1-项集编码为实数串,并将频繁1-项集非零项按原来所在位置随机组合编码,共同组成嵌套子窗口内的初始种群,此种群中个体为待考察频繁项集模式。具体过程如下:
(1)统计A、B和C的属性值为V1,V2,V3的个数分别作为第一列、第二列和第三列;
(2)大于等于阈值N的保留,并按其所对应的行进行赋值,小于N的赋值0,并去掉(本例N取3);
(3)将每一个非0值单独成一行,并保持其原来所在行的位置,其余位置填0;
(4)非零项按原来所在位置随机组合编码,共同组成初始种群;
过程如图4所示,该步骤的函数是采用GPUCUDA编程模式,采用流技术和共享存储器等优化手段,将每个属性的求解过程进行并行处理;
5)计算个体支持度值是初始种群内待考察频繁模式与实际事务匹配的过程。当个体支持度值大于S时,将该个体模式加入当前子窗口频繁项集内。Fi=Wi/WZ,Fi为事务i的支持度,Wi为当前子窗口内具有相同属性值的事务条数,WZ为当前子窗口内事务总条数;
6)分Z段并行匹配,虽然增大了内存开销,但大量减少运行时间,对于数据流频繁项集挖掘具有很大意义。并行匹配,过程如图5所示;
7)选择。将种群中个体按支持度值进行轮盘选择;
8)交叉。以交叉概率P进行一次交叉;
9)变异。个体按变异概率Q进行基本位变异;
10)扫描确定变异后个体支持度值,新增的满足条件的个体添加到频繁项集中;
11)判断结束条件。如迭代次数小于T,转步骤3,T次迭代运算后,则终止迭代并获得当前嵌套子窗口内数据的频繁项集;
12)随着数据流的流动,继续处理新接收到的数据,并抛弃最早的数据,转步骤S102继续以上操作,至数据流结束为止;
实施例2
获得当前滑动窗口内数据的频繁项集,步骤如下:
1)本次获得的各个频繁项集模式与之前U(U=w1/w2-1)次获得的频繁项集模式共同组成初始种群,进行一次搜索,最终满足条件的模式个体为滑动窗口内数据的频繁项集。过程如图6和图7所示;
(1)Fori=1:U+1;
(2)将各段得到的频繁模式组合成为频繁模式群;
(3)End;
(4)将频繁模式群在滑动窗口SW内进行一次并行搜索;
(5)支持度大于S的最终确定为频繁模式;函数采用OpenMP共享编程模式进行多线程并行处理;
(6)随着数据流的流动,继续处理新接收到的数据,并抛弃最早的数据,转步骤S102继续以上操作,至数据流结束为止。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (1)

1.一种基于嵌套滑动窗口和遗传算法的并行处理方法,其特征在于,采用基于滑动窗口之上的嵌套子窗口模型和利用遗传算法,根据数据流数据量大需要实时处理的特点,采用图形处理器GPU-CUDA并行处理技术来进行动态挖掘出最新数据的频繁项集,综合处理滑动窗口内各嵌套子窗口中频繁项集,获得当前滑动窗口内数据的频繁项集,最后采用遗传算法的并行模式,得到数据流的频繁项集模式,获得当前滑动窗口内数据的频繁项集的步骤,包括:
1)滑动窗口内的数据分成Z段,将每个嵌套子窗口内的数据交给一个线程进行并行处理以获得初始种群,计算个体支持度值是初始种群内待考察频繁模式与实际个体匹配的过程,选择,交叉,变异,扫描确定变异后个体支持度值,判断结束条件;
2)获得的各个频繁项集模式与之前U次获得的频繁项集模式共同组成初始种群,进行一次搜索,最终满足条件的模式个体为滑动窗口内数据的频繁项集,随着数据流的流动,继续处理新接收到的数据,并抛弃最早的数据;其中,U=w1/w2-1;w1为滑动窗口SW大小,w2为子窗口S_SW大小;
3)利用遗传算法的并行性搜索嵌套子窗口内最新数据的频繁项集,从一组初始种群开始搜索过程,种群中的每个个体是一个可能的频繁模式,遗传算法通过交叉、变异、选择运算实现,经过若干代选择之后,得到最终频繁项集,其中变异操作是通过动态、随机改变个体中某些基因而产生新的个体,变异操作是产生全局最优的一个重要原因,有助于增加种群的多样性,但本算法中频繁项集产生所需的各对应非零基因都已存在,经交叉操作产生的基因涵盖所有频繁项集,因此采用一个较低的变异率;
4)综合处理滑动窗口内各嵌套子窗口中频繁项集,最终获得当前滑动窗口内数据的频繁项集;
5)随着新数据的流入,周期性删除过期流数据,并重复以步骤3)、步骤4)的操作;
利用遗传算法的并行性搜索嵌套子窗口内最新数据的频繁项集的具体步骤如下:
(1)设定滑动窗口SW及子窗口S_SW大小,分别为w1、w2,输入各类参数之后,根据数据流属性来确定窗口大小,SW内容是根据当前多少条个体的频繁项集的兴趣度来决定的,子窗口是根据数据的处理能力以及被抛弃的旧数据条数来确定,也决定了需求所要求统计的频率:
(2)给定支持度阈值S,若某个个体i,其支持度为Fi,当Fi>=S,个体i即为滑动窗口内数据集的频繁项集模式;
(3)个体的属性种数、各属性的取值范围以及生成原始种群大小来确定最大进化迭代次数T,处理方法是采用子窗口模型,避免在旧数据被淘汰之后,对滑动窗口SW内存在的数据进行多次重复处理;设置进化迭代次数t=0;
(4)设定交叉概率P,个体变异概率Q,子窗口内的数据分成Z段并行计算,函数采用显卡图形处理器GPU-CUDA并行技术,将每个子窗口内的数据交给一个线程进行并行处理;
(5)初始种群的数据在流动过程中,获取子窗口内最新到来的数据,同时得到此数据的频繁1-项集,将频繁1-项集编码为实数串,并将频繁1-项集非零项按原来所在位置随机组合编码,共同组成嵌套子窗口内的初始种群,此种群中个体为待考察频繁项集模式;
获得初始种群的具体步骤包括:
a)统计A、B和C的属性值为V1,V2,V3的个数分别作为第一列、第二列和第三列;A、B和C表示子窗口的最新分块数据;
b)N为预设阀值,最新分块数据大于等于阈值N的保留,并按其所对应的行进行赋值,小于N的赋值0去掉;
c)将每一个非0值单独成一行,并保持其原来所在行的位置,其余位置填0;
d)非零项按原来所在位置随机组合编码,共同组成初始种群;函数是采用GPUCUDA编程模式,采用流技术和共享存储器的优化手段,将每个属性的求解过程进行并行处理;
e)计算个体支持度值是初始种群内待考察频繁模式与实际个体匹配的过程,当个体支持度值大于S时,将该个体加入当前子窗口频繁项集内,Fi=Wi/Wz,Fi为个体i的支持度,Wi为当前子窗口内具有相同属性值的个体条数,Wz为当前子窗口内个体总条数;
f)分Z段并行匹配;
g)选择:将种群中个体按支持度值进行轮盘选择;
h)交叉:以交叉概率P进行一次交叉;
i)变异:个体按变异概率Q进行基本位变异;
j)将进化迭代次数t加1;
k)扫描确定变异后个体支持度值,新增的满足条件的个体添加到频繁项集中;
l)判断结束条件,进化迭代次数小于T,转入步骤c),T次迭代运算后,则终止迭代并获得当前嵌套子窗口内数据的频繁项集;
m)随着数据流的流动,继续处理新接收到的数据,并抛弃最早的数据,转入步骤2)继续以上操作,至数据流结束为止。
CN201210116428.3A 2012-04-20 2012-04-20 一种基于嵌套滑动窗口和遗传算法的并行处理方法 Active CN102662642B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210116428.3A CN102662642B (zh) 2012-04-20 2012-04-20 一种基于嵌套滑动窗口和遗传算法的并行处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210116428.3A CN102662642B (zh) 2012-04-20 2012-04-20 一种基于嵌套滑动窗口和遗传算法的并行处理方法

Publications (2)

Publication Number Publication Date
CN102662642A CN102662642A (zh) 2012-09-12
CN102662642B true CN102662642B (zh) 2016-05-25

Family

ID=46772143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210116428.3A Active CN102662642B (zh) 2012-04-20 2012-04-20 一种基于嵌套滑动窗口和遗传算法的并行处理方法

Country Status (1)

Country Link
CN (1) CN102662642B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133370A (zh) * 2017-06-19 2017-09-05 南京邮电大学 一种基于关联规则的标签推荐方法

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258147B (zh) * 2013-05-24 2016-12-28 重庆邮电大学 一种基于gpu的并行演化超网络dna微阵列基因数据分类系统及方法
CN103279332A (zh) * 2013-06-09 2013-09-04 浪潮电子信息产业股份有限公司 一种基于gpu-cuda平台以及遗传算法的数据流并行处理方法
CN103543989A (zh) * 2013-11-11 2014-01-29 镇江中安通信科技有限公司 一种面向大数据的针对可变长度特征提取的自适应并行处理方法
CN104102476A (zh) * 2014-08-04 2014-10-15 浪潮(北京)电子信息产业有限公司 非规则流中高维数据流典型相关性并行计算方法及装置
DE202016007901U1 (de) * 2015-08-05 2017-04-03 Google Inc. Datenfluss - Fenster- und Triggerfunktion
CN105426163A (zh) * 2015-10-27 2016-03-23 浪潮(北京)电子信息产业有限公司 一种基于mic协处理器的单数据流分位数处理方法
CN105740457A (zh) * 2016-02-15 2016-07-06 浪潮电子信息产业股份有限公司 一种基于cpu+mic协同计算的近期数据流频繁项集挖掘方法
CN106919694A (zh) * 2017-03-07 2017-07-04 郑州云海信息技术有限公司 一种基于knl集群的近期数据流项集挖掘方法与装置
CN107835201A (zh) * 2017-12-14 2018-03-23 华中师范大学 网络攻击检测方法及装置
CN108520027B (zh) * 2018-03-20 2020-09-29 大连理工大学 一种基于cuda框架的gpu加速的频繁项集挖掘方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0447228A2 (en) * 1990-03-16 1991-09-18 Hewlett-Packard Company Data stream concentrator providing attribute data storage and graphics pipeline access
US5752067A (en) * 1990-11-13 1998-05-12 International Business Machines Corporation Fully scalable parallel processing system having asynchronous SIMD processing
CN101119302A (zh) * 2007-09-06 2008-02-06 华中科技大学 一种挖掘事务数据流上最近时间窗口内频繁模式的方法
CN101667197A (zh) * 2009-09-18 2010-03-10 浙江大学 基于滑动窗口的数据流关联规则挖掘方法
CN101887450A (zh) * 2010-05-19 2010-11-17 东北电力大学 一种随机型分布式数据流频繁项集挖掘系统及其方法
CN102289507A (zh) * 2011-08-30 2011-12-21 王洁 一种基于滑动窗口的数据流加权频繁模式挖掘方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0447228A2 (en) * 1990-03-16 1991-09-18 Hewlett-Packard Company Data stream concentrator providing attribute data storage and graphics pipeline access
US5752067A (en) * 1990-11-13 1998-05-12 International Business Machines Corporation Fully scalable parallel processing system having asynchronous SIMD processing
CN101119302A (zh) * 2007-09-06 2008-02-06 华中科技大学 一种挖掘事务数据流上最近时间窗口内频繁模式的方法
CN101667197A (zh) * 2009-09-18 2010-03-10 浙江大学 基于滑动窗口的数据流关联规则挖掘方法
CN101887450A (zh) * 2010-05-19 2010-11-17 东北电力大学 一种随机型分布式数据流频繁项集挖掘系统及其方法
CN102289507A (zh) * 2011-08-30 2011-12-21 王洁 一种基于滑动窗口的数据流加权频繁模式挖掘方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133370A (zh) * 2017-06-19 2017-09-05 南京邮电大学 一种基于关联规则的标签推荐方法

Also Published As

Publication number Publication date
CN102662642A (zh) 2012-09-12

Similar Documents

Publication Publication Date Title
CN102662642B (zh) 一种基于嵌套滑动窗口和遗传算法的并行处理方法
CN103279332A (zh) 一种基于gpu-cuda平台以及遗传算法的数据流并行处理方法
CN109190857B (zh) 一种基于多目标资源受限项目调度模型的优化算法
CN102214213B (zh) 一种采用决策树的数据分类方法和系统
Helaers et al. MetaPIGA v2. 0: maximum likelihood large phylogeny estimation using the metapopulation genetic algorithm and other stochastic heuristics
Kim et al. An endosymbiotic evolutionary algorithm for the integration of balancing and sequencing in mixed-model U-lines
Gao et al. An efficient memetic algorithm for solving the job shop scheduling problem
Raidl Decomposition based hybrid metaheuristics
CN103235974B (zh) 一种提高海量空间数据处理效率的方法
Purshouse On the evolutionary optimisation of many objectives
CN109902873A (zh) 一种基于改进型鲸鱼算法的云制造资源配置的方法
Schulz High quality graph partitioning
Toledo et al. Global optimization using a genetic algorithm with hierarchically structured population
CN1450493A (zh) 实现遗传算法的神经网络系统
CN105740457A (zh) 一种基于cpu+mic协同计算的近期数据流频繁项集挖掘方法
Schmidt et al. Phylogenetic inference using maximum likelihood methods
CN106611231A (zh) 一种混合粒子群禁忌搜索算法求解作业车间调度问题
CN105512954A (zh) 一种针对大规模柔性作业车间调度的集成搜索方法
Chugh et al. Surrogate-assisted evolutionary biobjective optimization for objectives with non-uniform latencies
CN103226759A (zh) 基于遗传算法的动态云工作流调度方法
CN109582985A (zh) 一种改进的遗传退火的片上网络映射方法
Abdelhalim et al. A new method for learning decision trees from rules
CN103582880B (zh) 压缩匹配枚举
CN101256648A (zh) 一种应用在生产排程系统的基于订单结构的遗传操作算子
CN104635709B (zh) 考虑费用和时间双目标的柔性综合调度方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant