CN103810371A - 海量数据集上主观兴趣度的关联规则优化算法 - Google Patents

海量数据集上主观兴趣度的关联规则优化算法 Download PDF

Info

Publication number
CN103810371A
CN103810371A CN201310265305.0A CN201310265305A CN103810371A CN 103810371 A CN103810371 A CN 103810371A CN 201310265305 A CN201310265305 A CN 201310265305A CN 103810371 A CN103810371 A CN 103810371A
Authority
CN
China
Prior art keywords
degree
template
consequent
interest
former piece
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310265305.0A
Other languages
English (en)
Other versions
CN103810371B (zh
Inventor
牛新征
周冬梅
侯孟书
杨健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201310265305.0A priority Critical patent/CN103810371B/zh
Publication of CN103810371A publication Critical patent/CN103810371A/zh
Application granted granted Critical
Publication of CN103810371B publication Critical patent/CN103810371B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种海量数据集上主观兴趣度的关联规则优化算法,本发明使用复合模板同时优化分析,即分为总体印象知识模板(GI)、相对精确知识模板(RPC),这种分类扩大了用户含义表达范围,有助于从不同侧重点对关联规则进行优化,此外,把限制与包含模板的作用转而体现在不同兴趣度上,细化兴趣度为四种类型,包括一致度、后件不可预知度、前件不可预知度、不可预知度,使得优化粒度非常清晰;优化结合了复合模板的兴趣度计算模型,使得兴趣度的计算能合理适应复合分析环境。

Description

海量数据集上主观兴趣度的关联规则优化算法
技术领域
本发明是一种有关海量数据集上主观兴趣度的关联规则优化算法,该方法能够发现大量数据中项集之间有趣的关联或者相关联系,可以帮助许多商务决策的制定,如分类设计、交叉购物和贱卖分析等,属于关联规则挖掘中的关联规则优化算法领域。
背景技术
对海量数据进行关联挖掘导出的关联规则数量巨大,这给分析、决策人员的判断带来了困难,而且仅基于支持度-置信度框架的传统关联规则挖掘算法并不能指出用户真正感兴趣的规则,给用户对所导出规则的分析带来了不便,规则优化则成为了提升规则质量、发现有价值规则的有效手段。
目前现有的规则优化算法主要从两个方面对关联规则进行优化:
1.客观关联规则优化:一般从规则的结构、集合性质、统计结果、离差模型等入手进行分析,这类方法包括RuleCover算法、冗余删除算法。客观性优化方法能有效删除多余、无效的规则。
2.主观关联规则优化:一般利用领域知识、模板、兴趣度等主观量度对规则进行分析。Piatetsky-Shapiro首先提出了兴趣度问题。Hoschka和Klosgen首次提出模板的概念。离差分析法被提出用来衡量真实结果与期望结果间的距离,而Piatetsky-Shapiro和Matheus把离差与兴趣度相结合,分析了离差的兴趣度。Klemettinen等人在中也提出了规则模板的概念,并使用包含模板和限制模板分别过滤有趣规则和非有趣规则。
虽然客观优化方法删除多余规则的效果明显,但无法实现主观优化方法所带来的优点。从用户需求分析,对主观思路进行研究有以下两点意义:①面对挖掘出来的规则,用户唯一的目标就是去寻找那些特殊的、没有被发现的规则。若仅给出一堆杂乱无序的规则,用户便需要花费较多的时间来分析和发现有价值的规则。②当规则数量成千上万时,用户希望能快速切入主题、发现价值,而不是面对规则无从下手。
同时,模板是主观兴趣度算法中使用到的一个重要的工具,是用户表达含义的载体,但目前基于模板的优化方法一般仅涉及一个模板的分析。兴趣度是规则有趣程度的客观度量,目前基于兴趣度的优化方法一般结合具体领域知识提出相应的兴趣度计算模型,用来衡量规则的有趣程度。
然而,在一般的规则优化方案中,模板使用单一模板进行优化分析,用户含义表达受限;模板类型种类少,部分论文提出限制模板、包含模板这两种模板类型用于过滤与匹配规则。另一方面兴趣度,一般只涉及一种兴趣度类型,分析的细化程度受限;兴趣度计算模型单一、杂乱,优化效果难以评判。
发明内容
本发明针对目前兴趣度优化算法存在的不足:兴趣度计算方法欠妥;用户含义表达受限;领域知识、模板、兴趣度等主观量度未有机结合,本算法提出了一种海量数据集上主观兴趣度的关联规则优化算法对上述不足进行了改进
本发明为解决上述技术问题所采用的技术方案是:
海量数据集上主观兴趣度的关联规则优化算法,其特征在于该优化算法包括:
1-(a).数据获取步骤:为优化算法提供基础数据;
1-(b).用户指定模板步骤:所述模板是用户表达含义的载体,具体地:形如A1...Ai...Ak=>Ak+1,的蕴含式,其中Ai可以是属性名、类名或者C+、C*的表达式,若为C+表示一个或多个类C的实例,若为C*表示零或多个类C的实例;用户选择指定GI模板、RPC模板或者同时指定GI模板和RPC模板;
所述GI模板:用户因项间关系模糊而给出的不确定的知识模板,称为总体印象知识模板,简称GI模板,表示为gi[S1,...,Sm]其中,Si可以是一个属性名、类名或者一条表达式;
所述RPC模板:用户知晓项间关系且明确关系方向而给出的相对合理的知识模板,称为相对精确知识模板,简称RPC,表示为rpc[S1,...,Sm=>V1,...,Vg]其中,Sk可以是一个属性名、类名或者一条表达式;
1-(c).解析模板步骤:根据模板对待优化的关联规则进行扫描计数;
1-(d).获取相关参数步骤:获取模板的相关数据及不匹配度量;
1-(e).计算模板权重累计值步骤:当指定多个模板时,模板权重为weight=1/n,其中n模板数,设Xij、Yij分别为Ri中前件、后件与GIj或RPCj中前件、后件不匹配程度的度量。TXi为Xij的权重累计值,TYi为Yij的权重累计值。TXi、TYi按如下公式计算:
TXi=TXi+1/n*Xij;
TYi=TYi+1/n*Yij;
1-(f).兴趣度计算:
1-(f-1).根据公式计算一致度的步骤:规则Ri的兴趣度表示规则前件、后件与指定模板集U匹配的程度,用符号confi表示,称为规则Ri的一致度;
confi=TXi*TYi
1-(f-2).根据公式计算后件不可预知度的步骤:规则Ri的兴趣度表示规则后件与指定模板集U不匹配的程度,用符号unexpYi表示,称为规则Ri的后件不可预知度;
unexpY i = TX i - TY i , TX i - TY i > 0 0 , TX i - TY i ≤ 0
1-(f-3).根据公式计算前件不可预知度的步骤:规则Ri的兴趣度表示规则前件与指定模板集U不匹配的程度,用符号unexpXi表示,称为规则Ri的前件不可预知度;
unexpX i = TY i - TX i , TY i - TX i > 0 0 , TY i - TX i ≤ 0
1-(f-4).根据公式计算不可预知度的步骤:规则Ri的兴趣度表示规则前件、后件与指定模板集U不匹配的程度,用符号unexpi表示,称为规则Ri的不可预知度;
unexpi=1-max(confi,unexpYi,unexpXi)。
进一步地,当用户仅指定GI模板时,所述一致度公式为:
conf 1 = 0 , TX 1 = 0 , TY 1 = 0 TY 1 , TX 1 = 0 , TY 1 ≠ 0 T X 1 , TX 1 ≠ 0 , TY 1 = 0 TX 1 * TY 1 , others .
具体地,所述获取相关参数步骤包含:
若为GI模板:
设TNj为GIj中元素总数;XMij、YMij分别为Ri中前件、后件与GIj中元素相匹配的个数;TMij为GIj中已被Ri中元素所匹配的元素总数
若TNj=0,则TMij/TNj=1
X ij = min ( XM ij / XN i , TM ij / TN j ) , if XM ij / XN i > YM ij / YN i XM ij / XN i , else XN ij / XN i ≤ YM ij / YN i
Y ij = YM ij / YN i , if XM ij / XN i > YM ij / YN i min ( YM ij / YN i , TM ij / TN j ) , else XM ij / XN i ≤ YM ij / YN i
若为RPC模板:
设TXNj、TYNj分别为RPCj中前件、后件所含元素总数;XMij、YMij分别为Ri中前件、后件与RPCj中前件、后件所含元素相匹配的个数;TXMij、TYMij分别为RPCj中前件、后件已被Ri中前件、后件所匹配的元素总数
若TXNj=0,则TXMij/TXNj=1
若TYNj=0,则TYMij/TYNj=1
Xij=min(XMij/XNi,TXMij/TXNj)
Yij=min(YMij/YNi,TYMij/TYNj)。
进一步地,所述兴趣度计算完成后有对含不同类型兴趣度的规则集排序步骤。
由于本专利提出的基于主观兴趣度的关联规则优化算法涉及到模板、兴趣度两个方面,下面详细阐述这两点。
模板是主观兴趣度算法中使用到的一个重要的工具,是用户表达含义的载体,但目前基于模板的优化方法一般仅涉及一个模板的分析。兴趣度是规则有趣程度的客观度量,目前基于兴趣度的优化方法一般结合具体领域知识提出相应的兴趣度计算模型,用来衡量规则的有趣程度。
本专利引入模板权重模型和计算方法,丰富了用户含义。引入模板权重将支持用户指定多个模板同时进行分析,通过叠加多个模板的带权兴趣度得到最终兴趣度,从而实现多模板的最终兴趣度排序。
为便于描述,预先给出相关符号的说明:设有原始关联规则集R0={Xi
Figure BDA00003427779600051
Y|i=1,...,n},其中,Xi
Figure BDA00003427779600052
Y是关联规则,Ri为R0中的一条规则。XNi为规则Ri中前件Xi所含元素个数,YNi为规则Ri中后件Y所含元素个数。
设GI={GIj|j=0,...,l}为用户指定的GI模板集合,RPC={RPCj|j=0,...,k}为用户指定的RPC模板集合,U={Uj|Uj
Figure BDA00003427779600053
GI,或Uj RPC,j=1,...,n}为指定模板总集。
为简化算法描述,这里默认模板权重值为weight=1/n,n为U中模板数。设Xij、Yij分别为Ri中前件、后件与GIj或RPCj中前件、后件不匹配程度的度量(作为过渡值而无特殊含义)。TXi为Xij的权重累计值,TYi为Yij的权重累计值。TXi、TYi按如下公式计算:
TXi=TXi+1/n*Xij;TYi=TYi+1/n*Yij;
兴趣度作为对规则有趣程度的度量,从侧面反映了规则对用户而言价值的高低。
原一致度的计算缺乏特殊情况下的考虑,当指定的模板仅为GI时,规则的一致度值几乎全为零而将进行没有意义的排序。本专利引入对计算兴趣度的算法增加了仅指定一个GI模板情况下对一致度的分类处理,完善了兴趣度的计算方法和模型,计算方法如下:
当指定模板仅为GI模板时,若前、后件的权重累计值均为0,一致度才为0;若前、后件权重累计值之一为0,则一致度为权重累计值不为0的那个值;其他情况下一致度为前、后件权重累计值的乘积。
一致规则的兴趣度表示规则前件、后件与指定模板集匹配的程度,称为规则的一致度。通俗说,就是完全匹配度,与模板完全匹配的程度。
本专利中对计算兴趣度的算法增加了仅指定一个GI模板情况下对一致度confi的分类处理。当指定模板仅为GI模板时(此时i=1),计算i=1的公式如下:
conf 1 = 0 , TX 1 = 0 , TY 1 = 0 TY 1 , TX 1 = 0 , TY 1 ≠ 0 T X 1 , TX 1 ≠ 0 , TY 1 = 0 TX 1 * TY 1 , others
除此之外,confi仅由下列公式计算:confi=TXi*TYi
本算法的核心思想:对每条解析后的模板,均扫描一次规则集;扫描过程中,根据模板对每条规则进行多方面的统计;综合规则的各统计值,计算其一致度、后件不可预知度、前件不可预知度、不可预知度;最后,规则集基于其中一种兴趣度的值降序排列,并返回结果。
本发明的技术保护点和本发明有益效果:
1.单一模板下对兴趣度的特殊处理,完善了兴趣度的计算方法和模型,也就构建了完善的兴趣度的计算方法;
2.基于复合模板的兴趣度分析,从而实现多模板的最终兴趣度排序。
3.通过叠加多个模板的带权兴趣度得到最终兴趣度,对基于主观兴趣度的关联规则优化算法总流程进行再造,使得兴趣度的计算能合理适应复合分析环境,该新构建的主观兴趣度分析算法其优化能力得到了有效增强。
基于主观兴趣度的关联规则优化算法在指定一条GI模板时,计算兴趣度confi的值不会出现全为零而进行无意义排序的情况,且其支持用户指定多条模板,扩大了用户的分析范围,使用户能表达更加丰富的含义,有效增强了算法的优化能力。算法有效避免了按confi值无意义排序的情况,且多模板的支持使用户能表达更加丰富的含义,有效增强了算法的优化能力。而由于海量数据进行关联挖掘导出的关联规则数量巨大,该算法则可提升规则质量和更优地发现有价值规则。
附图说明
图1是不含模板的兴趣度优化流程图;
图2是支持多类复合模板的主观兴趣度优化流程图;
具体实施方式
为使本发明能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明:
主观兴趣度优化算法步骤:
1获取数据
示例数据说明:GA代表专业课成绩,一共有7门专业课GA1~GA7;GB代表基础课成绩,一共有7门基础课GB1~GB7。各个课程的等级用1、2、3来表示,1表示最差,2表示中等,3表示优秀。使用关联规则算法挖掘得到以下12条规则,这几条规则的特点是规则前件均为GA,规则后件均为GB。
编号 规则 编号 规则
R1 GA1-3→GB2-3 R7 GA4-1→GB7-2
R2 GA4-3→GB4-3 R8 GA6-2→GB7-2
R3 GA2-3→GB2-3 R9 GA5-1,GA2-2→GB2-2
R4 GA2-3→GB5-1 R10 GA5-2,GA1-2→GB3-2
R5 GA6-1→GB1-3 R11 GA6-1,GA3-3→GB6-3
R6 GA4-2→GB3-3 R12 GA7-2,GA3-3→GB4-3
2.用户指定模板
RPC[GA-good+→GB-good]   GI[GB2-3]
以上为RPC与GI的复合模板,其中GA-good表示成绩为3的所有GA课程,GB-good表示成绩为3的所有GB课程,加号“+”表示GA-good课程出现1次或1次以上。用户指定这个复合模板想表达含义是,专业课程学得好的是否能推出其基础课程也学得好。
3.计算模板权重累计值之前先获取两种模板下的相关参数
a)若为GI模板:
设TNj为GIj中元素总数;XMij、YMij分别为Ri中前件、后件与GIj中元素相匹配的个数;TMij为GIj中已被Ri中元素所匹配的元素总数。
若TNj=0,则TMij/TNj=1
X ij = min ( XM ij / XN i , TM ij / TN j ) , if XM ij / XN i > YM ij / YN i XM ij / XN i , else XN ij / XN i ≤ YM ij / YN i
Y ij = YM ij / YN i , if XM ij / XN i > YM ij / YN i min ( YM ij / YN i , TM ij / TN j ) , else XM ij / XN i ≤ YM ij / YN i
针对模板GI[GB2-3],TN1=1;XM1-1=0,XM2-1=0,XM3-1=0,……,XM12-1=0;YM1-1=1,YM2-1=0,YM3-1=1,……,YM12-1=0;TM1-1=1,TM2-1=0,TM3-1=1,……,TM12-1=0;Xi-1,Yi-1
b)若为RPC模板:
设TXNj、TYNj分别为RPCj中前件、后件所含元素总数;XMij、YMij分别为Ri中前件、后件与RPCj中前件、后件所含元素相匹配的个数;TXMij、TYMij分别为RPCj中前件、后件已被Ri中前件、后件所匹配的元素总数。
若TXNj=0,则TXMij/TXNj=1
若TYNj=0,则TYMij/TYNj=1
Xij=min(XMij/XNi,TXMij/TXNj)
Yij=min(YMij/YNi,TYMij/TYNj)
针对模板RPC[GA-good+→GB-good],有公式可得:TXN1=1,TYN1=1;XM1-1=1,XM2-1=1,XM3-1=1,……,XM12-1=1;YM1-1=1,YM2-1=1,YM3-1=1,……,YM12-1=1;TXM1-1=1,TXM2-1=1,TXM3-1=1,……,TXM12-1=1;TYM1-1=1,TYM2-1=1,TYM3-1=1,……,TYM12-1=1;Xi-1,Yi-1
4.计算模板权重累计值
这里默认模板权重值为weight=1/n,n为U中模板数。设Xij、Yij分别为Ri中前件、后件与GIj或RPCj中前件、后件不匹配程度的度量。TXi为Xij的权重累计值,TYi为Yij的权重累计值。TXi、TYi按如下公式计算:
TXi=TXi+1/n*Xij;
TYi=TYi+1/n*Yij;
上述实例中有weight=1/n=1/2;TXi,TYi按上述公式进行叠加计算出结果。
5.四种兴趣度的计算
当指定模板仅为GI模板时(此时i=1),计算confi的公式如下:
conf 1 = 0 , TX 1 = 0 , TY 1 = 0 TY 1 , TX 1 = 0 , TY 1 ≠ 0 T X 1 , TX 1 ≠ 0 , TY 1 = 0 TX 1 * TY 1 , others
除此之外,confi仅由下列公式计算:
confi=TXi*TYi
下列公式用于计算unexpYi、unexpXi、unexpi
unexpY i = TX i - TY i , TX i - TY i > 0 0 , TX i - TY i ≤ 0
unexpX i = TY i - TX i , TY i - TX i > 0 0 , TY i - TX i ≤ 0
unexpi=1-max(confi,unexpYi,unexpXi)
6.对含不同类型兴趣度的规则集排序,得到规则集排序结果。confi
Figure BDA00003427779600104
unexpYi
Figure BDA00003427779600105
unexpXi
Figure BDA00003427779600106
unexpi
Figure BDA00003427779600107
虽然这里结合具体的实施例对本发明进行了描述,但是对本领域技术人员来说,很多其它的变化、改进以及应用将是很明显的。因此,本发明不应当受此处特定公开的限制,而应由附加的权利要求来限定。

Claims (4)

1.海量数据集上主观兴趣度的关联规则优化算法,其特征在于该优化算法包括:
1-(a).数据获取步骤:为优化算法提供基础数据;
1-(b).用户指定模板步骤:所述模板是用户表达含义的载体,具体地:形如A1...Ai...Ak=>Ak+1,的蕴含式,其中Ai包含属性名、类名或者C+、C*的表达式,若为C+表示一个或多个类C的实例,若为C*表示零或多个类C的实例;用户选择指定GI模板、RPC模板或者同时指定GI模板和RPC模板;
所述GI模板:用户因项间关系模糊而给出的不确定的知识模板,称为总体印象知识模板,简称GI模板,表示为gi[S1,...,Sm]其中,Si类型包含一个属性名、类名或者一条表达式;
所述RPC模板:用户知晓项间关系且明确关系方向而给出的相对合理的知识模板,称为相对精确知识模板,简称RPC,表示为rpc[S1,...,Sm=>V1,...,Vg]其中,Sk类型包含一个属性名、类名或者一条表达式;
1-(c).解析模板步骤:根据模板对待优化的关联规则进行扫描计数;
1-(d).获取相关参数步骤:获取模板的相关数据及不匹配度量;
1-(e).计算模板权重累计值步骤:当指定多个模板时,模板权重为weight=1/n,其中n为模板数,设Xij、Yij分别为第i条相关规则Ri中前件、后件与GIj或RPCj中前件、后件不匹配程度的度量,TXi为Xij的权重累计值,TYi为Yij的权重累计值,TXi、TYi按如下公式计算:
TXi=TXi+1/n*Xij;
TYi=TYi+1/n*Yij;
1-(f).兴趣度计算:
1-(f-1).根据公式计算一致度的步骤:规则Ri的兴趣度表示规则前件、后件与指定模板集U匹配的程度,用符号confi表示,称为规则Ri的一致度;
confi=TXi*TYi
1-(f-2).根据公式计算后件不可预知度的步骤:规则Ri的兴趣度表示规则后件与指定模板集U不匹配的程度,用符号unexpYi表示,称为规则Ri的后件不可预知度;
unexp Y i = TX i - TY i , TX i - TY i > 0 0 , TX i - TY i ≤ 0
1-(f-3).根据公式计算前件不可预知度的步骤:规则Ri的兴趣度表示规则前件与指定模板集U不匹配的程度,用符号unexpXi表示,称为规则Ri的前件不可预知度;
unexp X i = TY i - TX i , TY i - TX i > 0 0 , TY i - TX i ≤ 0
1-(f-4).根据公式计算不可预知度的步骤:规则Ri的兴趣度表示规则前件、后件与指定模板集U不匹配的程度,用符号unexpi表示,称为规则Ri的不可预知度;
unexpi=1-max(confi,unexpYi,unexpXi)
2.根据权利要求1所述海量数据集上主观兴趣度的关联规则优化算法,当用户仅指定GI模板时,所述一致度公式为:
con f 1 = 0 , TX 1 = 0 , TY 1 = 0 TY 1 , TX 1 = 0 , TY 1 ≠ 0 TX 1 , TX 1 ≠ 0 , TY 1 = 0 TX 1 * TY 1 , others .
3.根据权利要求2所述海量数据集上主观兴趣度的关联规则优化算法,所述获取相关参数步骤包含:
若为GI模板:Xij、Yij分别为Ri中前件、后件与GIj或RPCj中前件、后件不匹配程度的度量
设TNj为GIj中元素总数;XMij、YMij分别为Ri中前件、后件与GIj中元素相匹配的个数;TMij为GIj中已被Ri中元素所匹配的元素总数,则Xij、Yij分别为Ri中前件、后件与GIj或RPCj中前件、后件不匹配程度的度量为:
若TNj=0,则TMij/TNj=1
X ij = min ( XM ij / XN i , TM ij / TN j ) , if XM ij / XN i > YM ij / YN i XM ij / XN i , else XM ij / XN i ≤ YM ij / YN i
Y ij = YM ij / YN i , if XM ij / XN i > YM ij / YN i min ( YM ij / YN i , TM ij / TN j ) , else XM ij / XN i ≤ YM ij / YN i
若为RPC模板:
设TXNj、TYNj分别为RPCj中前件、后件所含元素总数;XMij、YMij分别为Ri中前件、后件与RPCj中前件、后件所含元素相匹配的个数;TXMij、TYMij分别为RPCj中前件、后件已被Ri中前件、后件所匹配的元素总数:
若TXNj=0,则TXMij/TXNj=1
若TYNj=0,则TYMij/TYNj=1
Xij=min(XMij/XNi,TXMij/TXNj)
Yij=min(YMij/YNi,TYMij/TYNj)。
4.根据权利要求1-3中任意一条所述海量数据集上主观兴趣度的关联规则优化算法,所述兴趣度计算完成后,对含不同类型兴趣度的规则集排序步骤。
CN201310265305.0A 2013-06-28 2013-06-28 海量数据集上主观兴趣度的关联规则优化算法 Active CN103810371B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310265305.0A CN103810371B (zh) 2013-06-28 2013-06-28 海量数据集上主观兴趣度的关联规则优化算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310265305.0A CN103810371B (zh) 2013-06-28 2013-06-28 海量数据集上主观兴趣度的关联规则优化算法

Publications (2)

Publication Number Publication Date
CN103810371A true CN103810371A (zh) 2014-05-21
CN103810371B CN103810371B (zh) 2017-04-19

Family

ID=50707133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310265305.0A Active CN103810371B (zh) 2013-06-28 2013-06-28 海量数据集上主观兴趣度的关联规则优化算法

Country Status (1)

Country Link
CN (1) CN103810371B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111309787A (zh) * 2020-03-02 2020-06-19 广州大学 一种基于Apriori算法挖掘二维数据间关联规则的方法
CN111880499A (zh) * 2020-07-16 2020-11-03 国电黄金埠发电有限公司 一种火电厂运行参数在线优化系统及其优化方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090062941A1 (en) * 2007-08-29 2009-03-05 Jacked, Inc. Heat index
CN201667073U (zh) * 2009-11-23 2010-12-08 新汶矿业集团有限责任公司鄂庄煤矿 矿井通风网络解算的阻力测定数据管理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090062941A1 (en) * 2007-08-29 2009-03-05 Jacked, Inc. Heat index
CN201667073U (zh) * 2009-11-23 2010-12-08 新汶矿业集团有限责任公司鄂庄煤矿 矿井通风网络解算的阻力测定数据管理装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
伊卫国: "关联规则挖掘方法的改进", 《东北师大学报(自然科学版) 》, vol. 38, no. 2, 20 June 2006 (2006-06-20) *
周皓峰: "一个基于兴趣度的关联规则采掘算法", 《计算机研究与发展》, vol. 39, no. 4, 15 April 2002 (2002-04-15) *
张玉芳等: "基于兴趣度含正负项目的关联规则挖掘方法", 《电子科技大学学报 》, vol. 39, no. 3, 30 May 2010 (2010-05-30) *
李伟东等: "基于兴趣度的关联规则挖掘", 《计算机技术与发展 》, vol. 17, no. 6, 10 June 2007 (2007-06-10) *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111309787A (zh) * 2020-03-02 2020-06-19 广州大学 一种基于Apriori算法挖掘二维数据间关联规则的方法
CN111309787B (zh) * 2020-03-02 2021-10-19 广州大学 一种基于Apriori算法挖掘二维数据间关联规则的方法
CN111880499A (zh) * 2020-07-16 2020-11-03 国电黄金埠发电有限公司 一种火电厂运行参数在线优化系统及其优化方法
CN111880499B (zh) * 2020-07-16 2022-02-22 国电黄金埠发电有限公司 一种火电厂运行参数在线优化系统及其优化方法

Also Published As

Publication number Publication date
CN103810371B (zh) 2017-04-19

Similar Documents

Publication Publication Date Title
CN103325061B (zh) 一种社区发现方法和系统
CN103353923B (zh) 基于空间特征分析的自适应空间插值方法及其系统
CN109165664A (zh) 一种基于生成对抗网络的属性缺失数据集补全与预测方法
CN102982107A (zh) 一种融合用户、项目和上下文属性信息的推荐系统优化方法
CN105678590B (zh) 一种面向社交网络基于云模型的topN推荐方法
CN106355011A (zh) 一种地球化学数据元素序结构分析方法及装置
Gundert et al. On Laplacians of random complexes
Zhu et al. Network inference from consensus dynamics with unknown parameters
Zhang et al. Multi-attribute decision making: An innovative method based on the dynamic credibility of experts
Giscard et al. Evaluating balance on social networks from their simple cycles
Yang et al. Community detection via measuring the strength between nodes for dynamic networks
CN107545509A (zh) 一种多关系社交网络的社团划分方法
Wang et al. Roof pressure prediction in coal mine based on grey neural network
CN107944750A (zh) 一种贫困深度分析方法及系统
CN110716998B (zh) 一种精细尺度人口数据空间化方法
CN106649714B (zh) 针对数据不均匀及数据稀疏的topN推荐系统及方法
CN103810371A (zh) 海量数据集上主观兴趣度的关联规则优化算法
CN104133808B (zh) 基于复杂对应系统的用户行为一致性度测量方法
Kim et al. A simulated annealing algorithm for the creation of synthetic population in activity-based travel demand model
Kim Discrepancy Analysis of Activity Sequences: What Explains the Complexity of People's Daily Activity–Travel Patterns?
CN105183804A (zh) 一种基于本体的聚类服务方法
CN116055333A (zh) 基于高阶结构的网络关键团的识别方法
CN102163222B (zh) 基于标引关联关系的信息检索排序方法
CN108108399A (zh) 一种混合高斯建模改进的协同过滤推荐算法
Basri Novelty ranking approach with z-score and fuzzy multi-attribute decision making combination

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant