CN107544945A - 决策表的分布及变精度局部约简方法 - Google Patents

决策表的分布及变精度局部约简方法 Download PDF

Info

Publication number
CN107544945A
CN107544945A CN201710769746.2A CN201710769746A CN107544945A CN 107544945 A CN107544945 A CN 107544945A CN 201710769746 A CN201710769746 A CN 201710769746A CN 107544945 A CN107544945 A CN 107544945A
Authority
CN
China
Prior art keywords
decision
msub
matrix
mrow
classes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710769746.2A
Other languages
English (en)
Inventor
刘贵龙
李吉梅
花正
冯艳宾
邹继阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING LANGUAGE AND CULTURE UNIVERSITY
Original Assignee
BEIJING LANGUAGE AND CULTURE UNIVERSITY
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING LANGUAGE AND CULTURE UNIVERSITY filed Critical BEIJING LANGUAGE AND CULTURE UNIVERSITY
Priority to CN201710769746.2A priority Critical patent/CN107544945A/zh
Publication of CN107544945A publication Critical patent/CN107544945A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供的决策表的分布及变精度局部约简方法,能够在满足对决策表的某个决策类进行属性约简的同时,降低计算复杂度。所述变精度局部约简方法包括:通过获取的决策表数据,确定用于局部属性约简的某个决策类;计算所述决策类的局部分布矩阵;计算所述局部分布矩阵的β截矩阵;根据预先设置的局部属性变精度约简的定义及得到的β截矩阵,计算所述决策类的分辨矩阵;根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果。本发明适用于粗糙集的属性约简。

Description

决策表的分布及变精度局部约简方法
技术领域
本发明涉及数据挖掘、知识发现、模式识别与机器学习领域,特别是指决策表的分布及变精度局部约简方法。
背景技术
属性约简也称之为特征选取,来源于机器学习。属性约简在许多领域都有重要的应用,例如辅助决策、数据挖掘、模式识别等领域。
2016年,X.Jia等学者总结了22种属性约简类型,包括正区域约简、分布约简、变精度约简、覆盖约简、交互信息约简和代价敏感性约简。实际上,约简的类型有更多。目前,针对属性约简问题的研究,基本上属于对决策属性值的整体约简范畴。
一般说来,要计算出信息系统所有的约简,目前只能通过分辨矩阵的方法来实现,其基本的算法由波兰学者Skowron和Rauszer给出,大体上通过以下三个步骤来实现:
(1)计算分辨矩阵;
(2)将分辨函数从其主合取范式(conjunctive normal form,CNF)转换为主析取范式(disjunctive normal form,DNF);
(3)得出所有约简。
但该算法的计算复杂性较高,S.K.Wong和W.Ziarko在1985年已经证明:找出一个信息系统或决策表的所有属性约简子集(即一般关系属性约简),是一个NP-hard问题,其中,NP表示非确定性多项式(Non-deterministic Polynomial)。这是由数据组合爆炸引起的,不存在统一、规范的高效方法。
发明内容
本发明要解决的技术问题是提供决策表的分布及变精度局部约简方法,以解决现有技术所存在的计算复杂性高的问题。
为解决上述技术问题,本发明实施例提供一种决策表分布矩阵不变的局部属性约简方法,包括:
获取决策表数据;
根据获取的决策表数据,确定用于局部属性约简的某个决策类;
计算所述决策类的局部分布矩阵;
根据预先设置的局部属性分布约简的定义及得到所述决策类的局部分布矩阵,计算所述决策类的分辨矩阵;
根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果。
进一步地,设获取的决策表为(U,C∪D),其中,U表示论域,C表示条件属性集,D表示决策属性集,C和D均为U上的等价关系的集合;
所述根据获取的决策表数据,确定用于局部属性约简的某个决策类包括:
根据获取的决策表数据,确定论域U关于决策属性集D的商集,得到的商集为U/D={D1,D2,…,Dk},其中,Dl表示决策表的第l个决策类,l∈{1,2,……,k},k为正整数。
进一步地,对于任意的xi∈U和给定的正整数l∈{1,2,……k},决策类Dl的局部分布矩阵为:
其中,表示决策类Dl关于等价关系RC的局部分布矩阵,[xi]C为包含xi的关于等价关系RC的等价类,T表示转置,i∈{1,2,……,n},n表示论域U中元素的数目。
进一步地,所述局部属性分布约简的定义为:
设集合B为集合C的非空子集:若B满足:
(1)对于任意的x∈U,p(Dl|[x]C)=p(Dl|[x]B),其中,[x]C为包含x的关于等价关系RC的等价类;[x]B为包含x的关于等价关系RB的等价类,[x]B’为包含x的关于等价关系RB’的等价类;
(2)若则p(Dl|[x]C)≠p(Dl|[x]B′),其中,集合B′为集合B的非空真子集;
则称B为C的关于决策类Dl的局部属性分布约简;
所述根据预先设置的局部属性分布约简的定义及得到所述决策类的局部分布矩阵,计算所述决策类的分辨矩阵包括:
若B为C的关于决策类Dl的局部属性分布约简,则根据得到的决策类Dl的局部分布矩阵计算决策类Dl的分辨矩阵其中,
其中,xi,xj∈U,i,j∈{1,2,……,n},R(xi),R(xj)表示xi,xj在某个条件属性等价关系R上的取值。
进一步地,所述根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果包括:
根据得到的分辨矩阵,将相应的分辨函数,从主合取范式变换为主析取范式得到决策表保持分布矩阵不变的关于决策类Dl的全部约简结果,为{B1,B2,…,Bp};
其中,∧表示合取、∨表示析取,表示对分辨矩阵单元的各个R进行析取运算;f2中的每个B是R的合取,共有p个B,t的取值为t∈{1,2,……,p}。
本发明的上述技术方案的有益效果如下:
上述方案中,通过获取的决策表数据,确定用于局部属性约简的某个决策类;计算所述决策类的局部分布矩阵;根据预先设置的局部属性分布约简的定义及得到所述决策类的局部分布矩阵,计算所述决策类的分辨矩阵;根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果。这样,能够在满足对某个决策类的局部属性约简和局部规则提取的同时,降低计算复杂度;特别地,对于只有2个决策类的决策表,可以只针对任意一个决策类进行局部属性约简,其约简结果与全局属性约简一致,但能够提高计算效率。
本发明实施例还提供一种决策表截距阵不变的局部属性约简方法,包括:
获取决策表数据;
根据获取的决策表数据,确定用于局部属性约简的某个决策类;
计算所述决策类的局部分布矩阵;
计算所述局部分布矩阵的β截矩阵,其中,β是预设值,取值范围(0,1];
根据预先设置的局部属性变精度约简的定义及得到的β截矩阵,计算所述决策类的分辨矩阵;
根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果。
进一步地,设获取的决策表为(U,C∪D),其中,U表示论域,C表示条件属性集,D表示决策属性集,C和D均为U上的等价关系的集合;
所述根据获取的决策表数据,确定用于局部属性约简的某个决策类包括:
根据获取的决策表数据,确定论域U关于决策属性集D的商集,得到的商集为U/D={D1,D2,…,Dk},其中,Dl表示决策表的第l个决策类,l∈{1,2,……,k},k为正整数。
进一步地,对于任意的xi∈U和给定的正整数l∈{1,2,……k},决策类Dl的局部分布矩阵包括:
其中,表示决策类Dl关于等价关系RC的局部分布矩阵,[xi]C为包含xi的关于等价关系RC的等价类,T表示转置,i∈{1,2,……,n},n表示论域U中元素的数目。
进一步地,所述局部属性变精度约简的定义为:
设集合B为集合C的非空子集:且β∈(0,1],若B满足:
(1)其中,分别表示 的β截矩阵,分别表示决策类Dl关于等价关系RC、RB的局部分布矩阵;
(2)若其中,集合B′为集合B的非空真子集,表示的β截矩阵,表示决策类Dl关于等价关系RB’的分布矩阵;
则称B为C的关于决策类Dl的局部属性变精度约简;
所述根据预先设置的局部属性变精度约简的定义及得到的β截矩阵,计算所述决策类的分辨矩阵包括:
若B为C的关于决策类Dl的局部属性变精度约简,则根据得到的决策类Dl的局部分布矩阵的β截矩阵计算决策类Dl的β截矩阵的分辨矩阵其中,
且s=|{xi|(p(Dl|[xi]C))β=1}|,t=|{xi|(p(Dl|[xi]C))β=0}|
其中,xi,xj∈U,i,j∈{1,2,……,n},R(xi),R(xj)表示xi,xj在某个条件属性等价关系R上的取值,s、t表示中间参数。
进一步地,所述根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果包括:
根据得到的分辨矩阵,将相应的分辨函数,从主合取范式 变换为主析取范式得到决策表保持截距阵不变的关于决策类Dl的全部分布约简结果为{B1,B2,…,Bp};
其中,∧表示合取、∨表示析取,表示对分辨矩阵M(l,β)单元的各个R进行析取运算;f2中的每个B是R的合取,共有p个B,t的取值为t∈{1,2,……,p}。
本发明的上述技术方案的有益效果如下:
上述方案中,通过获取的决策表数据,确定用于局部属性约简的某个决策类;计算所述决策类的局部分布矩阵;计算所述局部分布矩阵的β截矩阵;根据预先设置的局部属性变精度约简的定义及得到的β截矩阵,计算所述决策类的分辨矩阵;根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果。这样,能够在满足对某个决策类的局部属性约简和局部规则提取的同时,降低计算复杂度;特别地,对于只有2个决策类的决策表,可以只针对任意一个决策类进行局部属性约简,其约简结果与全局属性约简一致,但能够提高计算效率。
附图说明
图1为本发明实施例一提供的决策表分布矩阵不变的局部属性约简方法的流程示意图;
图2为本发明实施例二提供的决策表截距阵不变的局部属性约简方法的流程示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明针对现有的计算复杂性高的问题,提供决策表的分布及变精度局部约简方法。
实施例一
如图1所示,本发明实施例提供的决策表分布矩阵不变的局部属性约简方法,包括:
S11,获取决策表数据;
S12,根据获取的决策表数据,确定用于局部属性约简的某个决策类;
S13,计算所述决策类的局部分布矩阵;
S14,根据预先设置的局部属性分布约简的定义及得到所述决策类的局部分布矩阵,计算所述决策类的分辨矩阵;
S15,根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果。
本发明实施例所述的决策表分布矩阵不变的局部属性约简方法,通过获取的决策表数据,确定用于局部属性约简的某个决策类;计算所述决策类的局部分布矩阵;根据预先设置的局部属性分布约简的定义及得到所述决策类的局部分布矩阵,计算所述决策类的分辨矩阵;根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果。这样,能够在满足对某个决策类的局部属性约简和局部规则提取的同时,降低计算复杂度;特别地,对于只有2个决策类的决策表,可以只针对任意一个决策类进行局部属性约简,其约简结果与全局属性约简一致,但能够提高计算效率。
在前述决策表分布矩阵不变的局部属性约简方法的具体实施方式中,进一步地,设获取的决策表为(U,C∪D),其中,U表示论域,C表示条件属性集,D表示决策属性集,C和D均为U上的等价关系的集合;
所述根据获取的决策表数据,确定用于局部属性约简的某个决策类包括:
根据获取的决策表数据,确定论域U关于决策属性集D的商集,得到的商集为U/D={D1,D2,…,Dk},其中,Dl表示决策表的第l个决策类,l∈{1,2,……,k},k为正整数。
本实施例中,设(U,C∪D)是一个决策表,论域U={x1,x2,…,xn},条件属性集C和决策属性集D均为U上的等价关系的集合,根据获取的决策表数据,确定论域U关于决策属性集D的商集,得到的商集为U/D={D1,D2,…,Dk}。假设D={d}只含有一个元素,则U关于D的商集为U/d={D1,D2,…,Dk},其中,Dl表示第l个决策类,l的取值为l∈{1,2,……,k},k为正整数。
在前述决策表分布矩阵不变的局部属性约简方法的具体实施方式中,进一步地,对于任意的xi∈U和给定的正整数l∈{1,2,……k},决策类Dl的局部分布矩阵为:
其中,表示决策类Dl关于等价关系RC的局部分布矩阵,[xi]C为包含xi的关于等价关系RC的等价类,T表示转置,i∈{1,2,……,n},n表示论域U中元素的数目。
在前述决策表分布矩阵不变的局部属性约简方法的具体实施方式中,进一步地,所述局部属性分布约简的定义为:
设集合B为集合C的非空子集:若B满足:
(1)对于任意的x∈U,p(Dl|[x]C)=p(Dl|[x]B),其中,[x]C为包含x的关于等价关系RC的等价类;[x]B为包含x的关于等价关系RB的等价类,[x]B’为包含x的关于等价关系RB’的等价类;
(2)若则p(Dl|[x]C)≠p(Dl|[x]B′),其中,集合B′为集合B的非空真子集;
则称B为C的关于决策类Dl的局部属性分布约简;
所述根据预先设置的局部属性分布约简的定义及得到所述决策类的局部分布矩阵,计算所述决策类的分辨矩阵包括:
若B为C的关于决策类Dl的局部属性分布约简,则根据得到的决策类Dl的局部分布矩阵计算决策类Dl的分辨矩阵其中,
其中,xi,xj∈U,i,j∈{1,2,……,n},R(xi),R(xj)表示xi,xj在某个条件属性等价关系R上的取值。
在前述决策表分布矩阵不变的局部属性约简方法的具体实施方式中,进一步地,所述根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果包括:
根据得到的分辨矩阵,将相应的分辨函数,从主合取范式变换为主析取范式得到决策表保持分布矩阵不变的关于决策类Dl的全部约简结果,为{B1,B2,…,Bp};
其中,∧表示合取、∨表示析取,表示对分辨矩阵M(l)单元的各个R进行析取运算;f2中的每个B是R的合取,共有p个B,t的取值为t∈{1,2,……,p}。
实施例二
如图2所示,本发明实施例还提供一种决策表截距阵不变的局部属性约简方法,包括:
S21,获取决策表数据;
S22,根据获取的决策表数据,确定用于局部属性约简的某个决策类;
S23,计算所述决策类的局部分布矩阵;
S24,计算所述局部分布矩阵的β截矩阵,其中,β是预设值,取值范围(0,1];
S25,根据预先设置的局部属性变精度约简的定义及得到的β截矩阵,计算所述决策类的分辨矩阵;
S26,根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果。
本发明实施例所述的决策表截距阵不变的局部属性约简方法,通过获取的决策表数据,确定用于局部属性约简的某个决策类;计算所述决策类的局部分布矩阵;计算所述局部分布矩阵的β截矩阵;根据预先设置的局部属性变精度约简的定义及得到的β截矩阵,计算所述决策类的分辨矩阵;根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果。这样,能够在满足对某个决策类的局部属性约简和局部规则提取的同时,降低计算复杂度;特别地,对于只有2个决策类的决策表,可以只针对任意一个决策类进行局部属性约简,其约简结果与全局属性约简一致,但能够提高计算效率。
在前述决策表截距阵不变的局部属性约简方法的具体实施方式中,进一步地,设获取的决策表为(U,C∪D),其中,U表示论域,C表示条件属性集,D表示决策属性集,C和D均为U上的等价关系的集合;
所述根据获取的决策表数据,确定用于局部属性约简的某个决策类包括:
根据获取的决策表数据,确定论域U关于决策属性集D的商集,得到的商集为U/D={D1,D2,…,Dk},其中,Dl表示决策表的第l个决策类,l∈{1,2,……,k},k为正整数。
本实施例中,设(U,C∪D)是一个决策表,论域U={x1,x2,…,xn},条件属性集C和决策属性集D均为U上的等价关系的集合,根据获取的决策表数据,确定论域U关于决策属性集D的商集,得到的商集为U/D={D1,D2,…,Dk}。假设D={d}只含有一个元素,则U关于D的商集为U/d={D1,D2,…,Dk},其中,Dl表示第l个决策类,l的取值为l∈{1,2,……,k},k为正整数。
在前述决策表截距阵不变的局部属性约简方法的具体实施方式中,进一步地,对于任意的xi∈U和给定的正整数l∈{1,2,……k},决策类Dl的局部分布矩阵包括:
其中,表示决策类Dl关于等价关系RC的局部分布矩阵,[xi]C为包含xi的关于等价关系RC的等价类,T表示转置,i∈{1,2,……,n},n表示论域U中元素的数目。
在前述决策表截距阵不变的局部属性约简方法的具体实施方式中,进一步地,所述局部属性变精度约简的定义为:
设集合B为集合C的非空子集:且β∈(0,1],若B满足:
(1)其中,分别表示 的β截矩阵,分别表示决策类Dl关于等价关系RC、RB的局部分布矩阵;
(2)若其中,集合B′为集合B的非空真子集,表示的β截矩阵,表示决策类Dl关于等价关系RB’的分布矩阵;
则称B为C的关于决策类Dl的局部属性变精度约简;
所述根据预先设置的局部属性变精度约简的定义及得到的β截矩阵,计算所述决策类的分辨矩阵包括:
若B为C的关于决策类Dl的局部属性变精度约简,则根据得到的决策类Dl的局部分布矩阵的β截矩阵计算决策类Dl的β截矩阵的分辨矩阵其中,
且s=|{xi|(p(Dl|[xi]C))β=1}|,t=|{xi|(p(Dl|[xi]C))β=0}|
其中,xi,xj∈U,i,j∈{1,2,……,n},R(xi),R(xj)表示xi,xj在某个条件属性等价关系R上的取值,s、t表示中间参数。
本实施例中,是局部分布矩阵的β截矩阵,β是预设值,取值范围(0,1],具体的:如果局部分布矩阵中的元素p(Dl|[xi]V)≥β,则相应的中的p(Dl|[xi]C)β=1,否则为0。
本实施例中, [xi]B为包含xi的关于等价关系RB的等价类; [xi]B’为包含xi的关于等价关系RB’的等价类,T表示转置。
在前述决策表截距阵不变的局部属性约简方法的具体实施方式中,进一步地,所述根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果包括:
根据得到的分辨矩阵,将相应的分辨函数,从主合取范式 变换为主析取范式得到决策表保持截距阵不变的关于决策类Dl的全部分布约简结果为{B1,B2,…,Bp};
其中,∧表示合取、∨表示析取,表示对分辨矩阵M(l,β)单元的各个R进行析取运算;f2中的每个B是R的合取,共有p个B,t的取值为t∈{1,2,……,p}。
为了对实施例二所述的决策表截距阵不变的局部属性约简方法进行验证,从加州大学欧文分校(University of California Irvine,UCI)机器学习数据库中选取2个数据集作为数据源进行测试,具体可参见表1。
表1数据集列表
数据集 对象个数 条件属性个数 决策属性个数 决策类个数
Statlog 946 18 1 3
Letter Recognition 20000 16 1 26
实验环境用Python 3.6.1编程实现实施例二所述的决策表截距阵不变的局部属性约简方法,并将表1中的2个数据集运行于(ASUS)X99-E WS,Intel(R)Core(TM)i7-6850KCPU 3.40GHz,Nvidia(R)GeForce GTX 1080Ti GPU 11GHz的计算机,其操作系统是Ubuntu17.04.接着对实验结果进行分析:
(1)Statlog数据集的属性约简
Statlog数据集(http://archive.ics.uci.edu/ml/datasets/Statlog+%28Vehicle+Silhouettes%29)包含了946个对象,18个条件属性和1个决策属性(包括4个决策类)。令xi(i=1,2,……,948)表示948个对象,{a,b,……,r}代表18个条件属性以及w代表决策属性,这样就可以得到一个决策表(U,C∪D),其中论域U={x1,x2,……,x948},条件属性集C={a,b,……,r}以及决策属性集{w}。该数据集的决策类有4个,根据实施例二所述的决策表截距阵不变的局部属性约简方法,得到如表2所示的属性约简结果。
表2 Statlog数据集的属性约简结果
由表2可知,针对某个决策类的变精度局部属性约简,其分辨矩阵的计算复杂度明显低于全局变精度属性约简,其中D1决策类的分辨矩阵计算时间耗用,当β=1时仅用了全局的12%,而当β=0.75时也只用了全局的12.3%,计算效率能提高87%以上。
(2)Letter Recognition数据集的属性约简
Letter Recognition数据集(http://archive.ics.uci.edu/ml/datasets/Letter+Recognition)包含了20000个对象,16个条件属性和1个决策属性(包括26个决策类)。
Letter Recognition数据集的目标,是基于已经确定的黑白像素矩形,进行26个大写字母的识别。26个字母中的每一个字母都是由黑白矩形像素渲染的,字母识别数据集正是由这些渲染的字母图像构成的。字符图像是基于20个不同的字体和每个字母在这20个字体被随机扭曲产生一个文件的20000个独特的矩阵。每个矩阵又被转换成16个原始的数值属性,然后缩放到一个范围内,即整数值0到15。
用{a,b,……,p}代表16个条件属性以及w代表决策属性,如表3所示。
表3字母识别数据集的属性和符号
属性 属性描述 属性 属性描述
a x-box horizontal position of box i y2bar mean y variance
b y-box vertical position of box j xybar mean x y correlation
c width width of box k x2ybr mean of x*x*y
d high height of box l xy2br mean of x*y*y
e onpix total#on pixels m x-ege mean edge count left to right
f x-bar mean x of on pixels in box n x-ege mean edge count left to right
g y-bar mean y of on pixels in box o y-ege mean edge count bottom to top
h x2bar mean x variance p yegvx correlation of y-ege with x
w capital letter(26values from A to Z)
这样,可以得到一个决策表(U,C∪D),其中,论域U={x1,x2,……,x20000},条件属性集C={a,b,……,p}以及决策属性集{w}。
为了方便数据统计,将决策属性的值,即字母,分成四类,这样决策属性D={D1,D2,D3,D4},其中D1={A,B,C,D,E,F},D2={G,H,I,J,K,L},D3={M,N,O,P,Q,R}和D4={S,T,U,V,W,X,Y,Z}。
首先,对Letter Recognition数据集多次执行实施例一、实施例二所述的约简方法,实验表明每种方法每次得到的约简结果一致;而且执行相应的全局属性约简,每次得到的约简结果也各自一致。
根据多次计算变精度属性约简的分辨矩阵的时间消耗平均值,得到如表4所示的统计表(针对实施例二所述的决策表截距阵不变的局部属性约简方法)。
表4 Letter Recognition数据集的变精度约简的局部与全局分辨矩阵计算的时间对比表
由表4可知,变精度局部属性约简算法,其分辨矩阵计算的时间消耗,明显低于相应的全局约简分辨矩阵计算的时间消耗。其中D3决策类集合(包括6个决策值)的时间耗用,当β=1时仅用了全局属性约简分辨矩阵计算时间的27%(平均每个决策类的时间耗用,仅占全局决策值的4.5%),而当β=0.75时也只用了全局的30.2%(平均每个决策类的时间耗用,仅占全局的5%),所以如果是需要D3决策类集合中某个决策类的变精度属性约简,则其计算分辨矩阵的效率可提高95%以上。
总之,以上2个数据集的实验结果表明,提出的局部属性约简定义及其相应的局部属性约简方法,可以满足对某个决策类的局部属性约简的需要,同时可以降低计算复杂度。
降低计算复杂度的程度,与数据集有关,比如Letter Recognition的变精度属性约简时,其局部属性约简的分辨矩阵计算效率可以提高95%;而Statlog数据集的局部属性变精度约简时,其分辨矩阵的计算效率可提高87%。
综上,本实施例中,为了减少计算复杂性,也为了满足对局部属性约简和局部规则提取的需要,提出了局部属性约简的概念并给出了2种定义和2种计算局部属性约简的算法。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种决策表分布矩阵不变的局部属性约简方法,其特征在于,包括:
获取决策表数据;
根据获取的决策表数据,确定用于局部属性约简的某个决策类;
计算所述决策类的局部分布矩阵;
根据预先设置的局部属性分布约简的定义及得到所述决策类的局部分布矩阵,计算所述决策类的分辨矩阵;
根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果。
2.根据权利要求1所述的决策表分布矩阵不变的局部属性约简方法,其特征在于,设获取的决策表为(U,C∪D),其中,U表示论域,C表示条件属性集,D表示决策属性集,C和D均为U上的等价关系的集合;
所述根据获取的决策表数据,确定用于局部属性约简的某个决策类包括:
根据获取的决策表数据,确定论域U关于决策属性集D的商集,得到的商集为U/D={D1,D2,…,Dk},其中,Dl表示决策表的第l个决策类,l∈{1,2,……,k},k为正整数。
3.根据权利要求2所述的决策表分布矩阵不变的局部属性约简方法,其特征在于,对于任意的xi∈U和给定的正整数l∈{1,2,……k},决策类Dl的局部分布矩阵为:
<mrow> <msub> <mi>W</mi> <msub> <mi>R</mi> <mi>C</mi> </msub> </msub> <msub> <mi>&amp;lambda;</mi> <msub> <mi>D</mi> <mi>l</mi> </msub> </msub> <mo>=</mo> <msup> <mrow> <mo>(</mo> <mi>p</mi> <mo>(</mo> <mrow> <msub> <mi>D</mi> <mi>l</mi> </msub> <mo>|</mo> <msub> <mrow> <mo>&amp;lsqb;</mo> <msub> <mi>x</mi> <mn>1</mn> </msub> <mo>&amp;rsqb;</mo> </mrow> <mi>C</mi> </msub> </mrow> <mo>)</mo> <mo>,</mo> <mi>p</mi> <mo>(</mo> <mrow> <msub> <mi>D</mi> <mi>l</mi> </msub> <mo>|</mo> <msub> <mrow> <mo>&amp;lsqb;</mo> <msub> <mi>x</mi> <mn>2</mn> </msub> <mo>&amp;rsqb;</mo> </mrow> <mi>C</mi> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>p</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>D</mi> <mi>l</mi> </msub> <mo>|</mo> <msub> <mrow> <mo>&amp;lsqb;</mo> <msub> <mi>x</mi> <mi>n</mi> </msub> <mo>&amp;rsqb;</mo> </mrow> <mi>C</mi> </msub> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mo>;</mo> </mrow>
其中,表示决策类Dl关于等价关系RC的局部分布矩阵,[xi]C为包含xi的关于等价关系RC的等价类,T表示转置,i∈{1,2,……,n},n表示论域U中元素的数目。
4.根据权利要求3所述的决策表分布矩阵不变的局部属性约简方法,其特征在于,所述局部属性分布约简的定义为:
设集合B为集合C的非空子集:若B满足:
(1)对于任意的x∈U,p(Dl|[x]C)=p(Dl|[x]B),其中,[x]C为包含x的关于等价关系RC的等价类;[x]B为包含x的关于等价关系RB的等价类,[x]B’为包含x的关于等价关系RB’的等价类;
(2)若则p(Dl|[x]C)≠p(Dl|[x]B′),其中,集合B′为集合B的非空真子集;
则称B为C的关于决策类Dl的局部属性分布约简;
所述根据预先设置的局部属性分布约简的定义及得到所述决策类的局部分布矩阵,计算所述决策类的分辨矩阵包括:
若B为C的关于决策类Dl的局部属性分布约简,则根据得到的决策类Dl的局部分布矩阵计算决策类Dl的分辨矩阵其中,
其中,xi,xj∈U,i,j∈{1,2,……,n},R(xi),R(xj)表示xi,xj在某个条件属性等价关系R上的取值。
5.根据权利要求4所述的决策表分布矩阵不变的局部属性约简方法,其特征在于,所述根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果包括:
根据得到的分辨矩阵,将相应的分辨函数,从主合取范式变换为主析取范式得到决策表保持分布矩阵不变的关于决策类Dl的全部约简结果,为{B1,B2,…,Bp};
其中,∧表示合取、∨表示析取,表示对分辨矩阵M(l)单元的各个R进行析取运算;f2中的每个B是R的合取,共有p个B,t的取值为t∈{1,2,……,p}。
6.一种决策表截距阵不变的局部属性约简方法,其特征在于,包括:
获取决策表数据;
根据获取的决策表数据,确定用于局部属性约简的某个决策类;
计算所述决策类的局部分布矩阵;
计算所述局部分布矩阵的β截矩阵,其中,β是预设值,取值范围(0,1];
根据预先设置的局部属性变精度约简的定义及得到的β截矩阵,计算所述决策类的分辨矩阵;
根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果。
7.根据权利要求6所述的决策表截距阵不变的局部属性约简方法,其特征在于,设获取的决策表为(U,C∪D),其中,U表示论域,C表示条件属性集,D表示决策属性集,C和D均为U上的等价关系的集合;
所述根据获取的决策表数据,确定用于局部属性约简的某个决策类包括:
根据获取的决策表数据,确定论域U关于决策属性集D的商集,得到的商集为U/D={D1,D2,…,Dk},其中,Dl表示决策表的第l个决策类,l∈{1,2,……,k},k为正整数。
8.根据权利要求7所述的决策表截距阵不变的局部属性约简方法,其特征在于,对于任意的xi∈U和给定的正整数l∈{1,2,……k},决策类Dl的局部分布矩阵包括:
<mrow> <msub> <mi>W</mi> <msub> <mi>R</mi> <mi>C</mi> </msub> </msub> <msub> <mi>&amp;lambda;</mi> <msub> <mi>D</mi> <mi>l</mi> </msub> </msub> <mo>=</mo> <msup> <mrow> <mo>(</mo> <mi>p</mi> <mo>(</mo> <mrow> <msub> <mi>D</mi> <mi>l</mi> </msub> <mo>|</mo> <msub> <mrow> <mo>&amp;lsqb;</mo> <msub> <mi>x</mi> <mn>1</mn> </msub> <mo>&amp;rsqb;</mo> </mrow> <mi>C</mi> </msub> </mrow> <mo>)</mo> <mo>,</mo> <mi>p</mi> <mo>(</mo> <mrow> <msub> <mi>D</mi> <mi>l</mi> </msub> <mo>|</mo> <msub> <mrow> <mo>&amp;lsqb;</mo> <msub> <mi>x</mi> <mn>2</mn> </msub> <mo>&amp;rsqb;</mo> </mrow> <mi>C</mi> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>p</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>D</mi> <mi>l</mi> </msub> <mo>|</mo> <msub> <mrow> <mo>&amp;lsqb;</mo> <msub> <mi>x</mi> <mi>n</mi> </msub> <mo>&amp;rsqb;</mo> </mrow> <mi>C</mi> </msub> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mi>T</mi> </msup> </mrow>
其中,表示决策类Dl关于等价关系RC的局部分布矩阵,[xi]C为包含xi的关于等价关系RC的等价类,T表示转置,i∈{1,2,……,n},n表示论域U中元素的数目。
9.根据权利要求8所述的决策表截距阵不变的局部属性约简方法,其特征在于,所述局部属性变精度约简的定义为:
设集合B为集合C的非空子集:且β∈(0,1],若B满足:
(1)其中,分别表示 的β截矩阵,分别表示决策类Dl关于等价关系RC、RB的局部分布矩阵;
(2)若其中,集合B′为集合B的非空真子集,表示的β截矩阵,表示决策类Dl关于等价关系RB’的分布矩阵;
则称B为C的关于决策类Dl的局部属性变精度约简;
所述根据预先设置的局部属性变精度约简的定义及得到的β截矩阵,计算所述决策类的分辨矩阵包括:
若B为C的关于决策类Dl的局部属性变精度约简,则根据得到的决策类Dl的局部分布矩阵的β截矩阵计算决策类Dl的β截矩阵的分辨矩阵其中,
且s=|{xi|(p(Dl|[xi]C))β=1}|,t=|{xi|(p(Dl|[xi]C))β=0}|
其中,xi,xj∈U,i,j∈{1,2,……,n},R(xi),R(xj)表示xi,xj在某个条件属性等价关系R上的取值,s、t表示中间参数。
10.根据权利要求9所述的决策表截距阵不变的局部属性约简方法,其特征在于,所述根据得到的分辨矩阵,将相应的分辨函数,从主合取范式转换为主析取范式,得到全部的约简结果包括:
根据得到的分辨矩阵,将相应的分辨函数,从主合取范式 变换为主析取范式得到决策表保持截距阵不变的关于决策类Dl的全部分布约简结果为{B1,B2,…,Bp};
其中,∧表示合取、∨表示析取,表示对分辨矩阵M(l,β)单元的各个R进行析取运算;f2中的每个B是R的合取,共有p个B,t的取值为t∈{1,2,……,p}。
CN201710769746.2A 2017-08-31 2017-08-31 决策表的分布及变精度局部约简方法 Pending CN107544945A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710769746.2A CN107544945A (zh) 2017-08-31 2017-08-31 决策表的分布及变精度局部约简方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710769746.2A CN107544945A (zh) 2017-08-31 2017-08-31 决策表的分布及变精度局部约简方法

Publications (1)

Publication Number Publication Date
CN107544945A true CN107544945A (zh) 2018-01-05

Family

ID=60957998

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710769746.2A Pending CN107544945A (zh) 2017-08-31 2017-08-31 决策表的分布及变精度局部约简方法

Country Status (1)

Country Link
CN (1) CN107544945A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110109811A (zh) * 2019-05-10 2019-08-09 北京物资学院 一种面向gpu计算性能问题的溯源方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103048686A (zh) * 2011-10-13 2013-04-17 陈红兵 一种快速求出地震属性约简的方法
CN106598743A (zh) * 2016-12-30 2017-04-26 重庆邮电大学 一种基于mpi并行求信息系统属性约简的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103048686A (zh) * 2011-10-13 2013-04-17 陈红兵 一种快速求出地震属性约简的方法
CN106598743A (zh) * 2016-12-30 2017-04-26 重庆邮电大学 一种基于mpi并行求信息系统属性约简的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
林春杰等: "基于变精度粗糙集的不完备决策表属性约简", 《计算机工程与应用》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110109811A (zh) * 2019-05-10 2019-08-09 北京物资学院 一种面向gpu计算性能问题的溯源方法

Similar Documents

Publication Publication Date Title
Tu et al. Hyperspectral classification with noisy label detection via superpixel-to-pixel weighting distance
Newman Spectral methods for community detection and graph partitioning
Boutsidis et al. Randomized dimensionality reduction for $ k $-means clustering
Boutsidis et al. Random projections for $ k $-means clustering
Martins et al. Visual analysis of dimensionality reduction quality for parameterized projections
Nosaka et al. Feature extraction based on co-occurrence of adjacent local binary patterns
Kleindessner et al. Kernel functions based on triplet comparisons
CN107341499A (zh) 一种基于无监督分割和elm的织物缺陷检测和分类方法
Tong et al. A density-peak-based clustering algorithm of automatically determining the number of clusters
Zhong et al. Two-pass hashing feature representation and searching method for copy-move forgery detection
Ren et al. Boosted mean shift clustering
Perret et al. Removing non-significant regions in hierarchical clustering and segmentation
Seiler et al. A collection of deep learning-based feature-free approaches for characterizing single-objective continuous fitness landscapes
Bayá et al. Clustering stability for automated color image segmentation
Wang et al. Chairs can be stood on: Overcoming object bias in human-object interaction detection
Montagner et al. Staff removal using image operator learning
Jiao et al. Non-local duplicate pooling network for salient object detection
CN107544945A (zh) 决策表的分布及变精度局部约简方法
Wu et al. Modified fuzzy clustering with segregated cluster centroids
Alsakran et al. Using entropy-related measures in categorical data visualization
CN113191359A (zh) 基于支持与查询样本的小样本目标检测方法与系统
CN107463707A (zh) 一种决策表下近似不变的局部属性约简定义及方法
Zhou et al. A strip dilated convolutional network for semantic segmentation
Zoller et al. Robust image segmentation using resampling and shape constraints
Kostin et al. Object recognition by symmetrised graph matching using relaxation labelling with an inhibitory mechanism

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180105

RJ01 Rejection of invention patent application after publication