CN104750847A - 一种基于动态平行坐标的关联规则可视化系统及方法 - Google Patents
一种基于动态平行坐标的关联规则可视化系统及方法 Download PDFInfo
- Publication number
- CN104750847A CN104750847A CN201510167946.1A CN201510167946A CN104750847A CN 104750847 A CN104750847 A CN 104750847A CN 201510167946 A CN201510167946 A CN 201510167946A CN 104750847 A CN104750847 A CN 104750847A
- Authority
- CN
- China
- Prior art keywords
- data
- visualization
- result
- association
- parallel coordinates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于动态平行坐标的关联规则可视化系统及方法,依赖R语言完成关联规则挖掘工作,转而借助JQuery的相关技术实现挖掘结果的可视化,生成的平行坐标图可以根据给定约束条件动态地部分显示,有效解决了现有技术中的问题。本发明依赖JQuery技术实现平行坐标,用户可以通过与图形的交互,过滤并显示感兴趣的关联规则,实现了动态的、交互式的可视化。
Description
技术领域
本发明涉及一种基于动态平行坐标的关联规则可视化系统及方法,属于数据挖掘技术领域。
背景技术
关联规则挖掘是指通过一定的手段发现大量数据中项集之间有趣的关联或相关联系,它在数据挖掘中是一个重要的课题,关联规则挖掘的一个典型例子是购物篮分析。关联规则研究有助于发现交易数据库中不同商品项之间的联系,找出顾客购买行为模式,如购买了某一商品对购买其他商品的影响,分析结果可以应用于商品货架布局、货存安排等。
关联规则挖掘算法常常会产生大量的规则,使用户分析和利用这些规则变得十分困难。可视化技术充分利用了图形和图像的表达能力以及人对于色彩和形状的敏锐感知能力,从而使用户可以更加方便并深入地对结果进行观察和分析。关联规则挖掘可视化是目前关联规则挖掘研究的一个重要方面。近年来,已经提出了多种可视化技术来支持用户对关联规则进行观察和分析。
现今,关联规则挖掘常用的可视化方法包括基于表的可视化技术、基于二维矩阵的可视化技术、基于有向图的可视化技术。但是,基于表、二维矩阵的可视化技术没有充分利用图形和图像的表达能力,而且在可视化多对一或是多对多关系的规则时,局限性是显而易见的;基于有向图的可视化技术虽然一定程度上解决了上述问题,但是在显示大量规则时容易产生界面紊乱的问题。
发明内容
本发明所要解决的技术问题是提供一种基于动态平行坐标的关联规则可视化系统及方法,依赖R语言完成关联规则挖掘工作,转而借助JQuery的相关技术实现挖掘结果的可视化,生成的平行坐标图可以根据给定约束条件动态地部分显示,有效解决了现有技术中的问题。
本发明为解决上述技术问题采用以下技术方案:
一方面,本发明提供一种基于动态平行坐标的关联规则可视化系统,包括逻辑处理单元、数据转换单元、可视化结果生成单元;逻辑处理单元,基于R语言封装起数据加载构件、数据预处理构件、关联规则挖掘构件,完成关联规则的挖掘工作,得到挖掘结果;数据转换单元,设计第一、第二函数,其中,第一函数用于将逻辑处理单元中的挖掘结果导出,第二函数将第一函数导出的挖掘结果转换为JQuery能够识别的数据结构进行保存;可视化结果生成单元,基于JQuery技术将数据转换单元中保存的挖掘结果绘制成平行坐标图。
作为本发明的进一步优化方案,数据加载构件将待挖掘的数据集加载至用户空间,并以数据框的形式保存。
作为本发明的进一步优化方案,数据预处理构件将数据加载构件加载的数据集转换为关联规则挖掘模型支持的数据格式,即将加载的数据集的每个属性都转化为因子。
作为本发明的进一步优化方案,关联规则挖掘构件结合数据集特点,调整关联规则挖掘模型的参数,将预处理后的数据集作为关联规则挖掘模型的输入文件,从而得到挖掘结果。
作为本发明的进一步优化方案,平行坐标图的组成为:用一系列等间隔且平行的竖直轴分别表示关联规则中出现的所有不同的项目,每条连接两个竖直轴的线段代表这两个相应项目之间的一条关联规则,竖直轴上的数值刻度表示关联规则的置信度。
另一方面,本发明还提供一种基于动态平行坐标的关联规则可视化方法,包括以下具体步骤:
步骤1,基于R语言封装起数据加载构件、数据预处理构件、关联规则挖掘构件,完成关联规则的挖掘工作,得到挖掘结果;
步骤2,设计第一、第二函数,其中,第一函数用于将步骤1中的挖掘结果导出,第二函数将第一函数导出的挖掘结果转换为JQuery能够识别的数据结构进行保存;
步骤3,基于JQuery技术将步骤2中保存的挖掘结果绘制成平行坐标图。
作为本发明的进一步优化方案,步骤1中数据加载构件将待挖掘的源数据集加载至用户空间,并以数据框的形式保存。
作为本发明的进一步优化方案,步骤1中数据预处理构件将数据加载构件加载的数据集转换为关联规则挖掘模型支持的数据格式,即将加载的数据集的每个属性都转化为因子。
作为本发明的进一步优化方案,步骤1中关联规则挖掘构件结合数据集特点,调整关联规则挖掘模型的参数,将预处理后的数据集作为关联规则挖掘模型的输入文件,从而得到挖掘结果。
作为本发明的进一步优化方案,步骤3中平行坐标图的组成为:用一系列等间隔且平行的竖直轴分别表示关联规则中出现的所有不同的项目,每条连接两个竖直轴的线段代表这两个相应项目之间的一条关联规则,竖直轴上的数值刻度表示关联规则的置信度。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:本发明提供的基于动态平行坐标的关联规则可视化方法,用动态的平行坐标将关联规则挖掘结果进行可视化,不但充分利用了图形和图像的表达能力以及人对于色彩和形状的敏锐感知能力,方便用户深入地对结果进行观察与分析,而且可以清晰地描述多对多关系的关联规则,当关联规则数量增多时,也不会有界面紊乱、产生歧义等问题出现。
附图说明
图1为本发明的可视化系统的结构示意图。
图2为本发明的可视化方法的流程图。
图3为本发明中数据预处理的流程图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
本发明所提供基于动态平行坐标的关联规则可视化系统,如图1所示,包括逻辑处理单元、数据转换单元、可视化结果生成单元。逻辑处理单元中基于R语言封装起数据加载构件、数据预处理构件、关联规则挖掘构件;数据加载构件将待挖掘的数据集加载至用户空间,并以数据框的形式保存;数据预处理构件将数据加载构件加载的数据集转换为关联规则挖掘模型支持的数据格式,即将加载的数据集的每个属性都转化为因子;关联规则挖掘构件结合数据集特点,调整关联规则挖掘模型的参数,将预处理后的数据集作为关联规则挖掘模型的输入文件,从而得到挖掘结果。数据转换单元中设计第一、第二函数,其中,第一函数用于将逻辑处理单元中的挖掘结果导出,第二函数将第一函数导出的挖掘结果转换为JQuery能够识别的数据结构进行保存;可视化结果生成单元中基于JQuery技术将数据转换单元中保存的挖掘结果绘制成平行坐标图。
本发明所提供的基于动态平行坐标的关联规则可视化方法的具体流程如图2所示:
步骤1,基于R语言封装起数据加载构件、数据预处理构件、关联规则挖掘构件,完成关联规则的挖掘工作,得到挖掘结果。
1)数据加载:利用R语言的read.table()函数,将csv、txt等格式的待挖掘的文本数据集加载至用户空间中,并以数据框的形式保存。
2)数据预处理:在此要自定义一个函数,用于将加载的数据框格式的数据集转换为关联规则挖掘模型支持的数据格式,函数流程如图3所示。具体的转换方式是用for循环遍历数据框的每个属性,调用is.factor()函数查找出返回值为no的属性,即这些非因子的属性不能作为挖掘模型的输入文件,接着借助R语言的as.factor()函数将此类属性转化为因子factor,以保证其能作为后续关联规则挖掘模型的输入文件。
3)关联规则挖掘:核心工作是为关联规则挖掘模型设置适当的参数,使得挖掘出的项集之间的相关关系更加准确、紧密。首先结合数据集特点设置关联规则的最小支持度,进而设置最小置信度,相关参数设置好后将预处理过的数据集作为输入文件,调用关联规则挖掘模型,从而得到初始挖掘结果。此时可以调用R语言的insepct()函数完成基于表、二维矩阵的可视化。
步骤2,设计第一、第二函数,其中,第一函数用于将步骤1中的挖掘结果导出,第二函数将第一函数导出的挖掘结果转换为JQuery能够识别的数据结构进行保存。
这一步骤的工作主要是将步骤1中的挖掘结果进行转换,使其能够满足后续生成可视化结果的要求。首先封装R语言的write.table()函数作为第一函数,用以将挖掘结果以数据框格式导出至磁盘空间的csv或txt文件中;然后设计第二函数,读取磁盘空间的挖掘结果文件,并将其转换为JQuery支持的Json等数据格式作为中间结果。
步骤3,基于JQuery技术将步骤2中保存的挖掘结果绘制成平行坐标图。这一步骤中将步骤2中的中间结果作为输入文件,基于JQuery技术绘制出平行坐标图,并在浏览器可视化出来。平行坐标图的基本组成情况是:用一系列等间隔且平行的竖直轴分别表示关联规则中出现的所有不同的项目,每条连接两个竖直轴的线段代表这两个相应项目之间的一条关联规则,竖直轴上的数值刻度表示关联规则的置信度。
本发明中的交互性在于,用户可以过滤并选择感兴趣的项目来部分显示,并且可以通过拖动的方式选中竖直轴上的一小段连续的数值,即选择以此项目作为前项或后项,且支持度落在选中区间的部分关联规则进行显示。用户可直接在浏览器与该平行坐标图进行交互,平行坐标图响应用户请求并即时动态变化。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (10)
1. 一种基于动态平行坐标的关联规则可视化系统,其特征在于,包括逻辑处理单元、数据转换单元、可视化结果生成单元;
逻辑处理单元,基于R语言封装起数据加载构件、数据预处理构件、关联规则挖掘构件,完成关联规则的挖掘工作,得到挖掘结果;
数据转换单元,设计第一、第二函数,其中,第一函数用于将逻辑处理单元中的挖掘结果导出,第二函数将第一函数导出的挖掘结果转换为JQuery能够识别的数据结构进行保存;
可视化结果生成单元,基于JQuery技术将数据转换单元中保存的挖掘结果绘制成平行坐标图。
2. 根据权利要求1所述的一种基于动态平行坐标的关联规则可视化系统,其特征在于,数据加载构件将待挖掘的数据集加载至用户空间,并以数据框的形式保存。
3. 根据权利要求2所述的一种基于动态平行坐标的关联规则可视化系统,其特征在于,数据预处理构件将数据加载构件加载的数据集转换为关联规则挖掘模型支持的数据格式,即将加载的数据集的每个属性都转化为因子。
4. 根据权利要求3所述的一种基于动态平行坐标的关联规则可视化系统,其特征在于,关联规则挖掘构件结合数据集特点,调整关联规则挖掘模型的参数,将预处理后的数据集作为关联规则挖掘模型的输入文件,从而得到挖掘结果。
5. 根据权利要求1所述的一种基于动态平行坐标的关联规则可视化系统,其特征在于,平行坐标图的组成为:用一系列等间隔且平行的竖直轴分别表示关联规则中出现的所有不同的项目,每条连接两个竖直轴的线段代表这两个相应项目之间的一条关联规则,竖直轴上的数值刻度表示关联规则的置信度。
6. 一种基于动态平行坐标的关联规则可视化方法,其特征在于,包括以下具体步骤:
步骤1,基于R语言封装起数据加载构件、数据预处理构件、关联规则挖掘构件,完成关联规则的挖掘工作,得到挖掘结果;
步骤2,设计第一、第二函数,其中,第一函数用于将步骤1中的挖掘结果导出,第二函数将第一函数导出的挖掘结果转换为JQuery能够识别的数据结构进行保存;
步骤3,基于JQuery技术将步骤2中保存的挖掘结果绘制成平行坐标图。
7. 根据权利要求6所述的一种基于动态平行坐标的关联规则可视化方法,其特征在于,步骤1中数据加载构件将待挖掘的源数据集加载至用户空间,并以数据框的形式保存。
8. 根据权利要求7所述的一种基于动态平行坐标的关联规则可视化方法,其特征在于,步骤1中数据预处理构件将数据加载构件加载的数据集转换为关联规则挖掘模型支持的数据格式,即将加载的数据集的每个属性都转化为因子。
9. 根据权利要求8所述的一种基于动态平行坐标的关联规则可视化方法,其特征在于,步骤1中关联规则挖掘构件结合数据集特点,调整关联规则挖掘模型的参数,将预处理后的数据集作为关联规则挖掘模型的输入文件,从而得到挖掘结果。
10. 根据权利要求6所述的一种基于动态平行坐标的关联规则可视化方法,其特征在于,步骤3中平行坐标图的组成为:用一系列等间隔且平行的竖直轴分别表示关联规则中出现的所有不同的项目,每条连接两个竖直轴的线段代表这两个相应项目之间的一条关联规则,竖直轴上的数值刻度表示关联规则的置信度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510167946.1A CN104750847B (zh) | 2015-04-10 | 2015-04-10 | 一种基于动态平行坐标的关联规则可视化系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510167946.1A CN104750847B (zh) | 2015-04-10 | 2015-04-10 | 一种基于动态平行坐标的关联规则可视化系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104750847A true CN104750847A (zh) | 2015-07-01 |
CN104750847B CN104750847B (zh) | 2018-07-06 |
Family
ID=53590531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510167946.1A Active CN104750847B (zh) | 2015-04-10 | 2015-04-10 | 一种基于动态平行坐标的关联规则可视化系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104750847B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108304500A (zh) * | 2018-01-17 | 2018-07-20 | 西南交通大学 | 一种基于类属性的平行坐标可视化曲线绑定方法 |
CN109923535A (zh) * | 2016-11-08 | 2019-06-21 | 微软技术许可有限责任公司 | 作为便携式用户应用对象的洞察对象 |
CN111158699A (zh) * | 2019-12-31 | 2020-05-15 | 青岛海尔科技有限公司 | 基于Apriori算法的应用优化方法、装置和智能设备 |
CN112232591A (zh) * | 2020-11-02 | 2021-01-15 | 国网湖南省电力有限公司 | 基于气象因素的覆冰厚度智能预警方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110175905A1 (en) * | 2010-01-15 | 2011-07-21 | American Propertunity, LLC. | Infoshape: displaying multidimensional information |
CN102332056A (zh) * | 2011-09-27 | 2012-01-25 | 浙江工业大学 | 基于信息可视化技术的房产数据可视化系统 |
CN102609507A (zh) * | 2012-02-03 | 2012-07-25 | 浙江工业大学 | 基于Web的数据可视化系统 |
CN102855662A (zh) * | 2012-07-25 | 2013-01-02 | 中国科学院对地观测与数字地球科学中心 | 海洋环境的可视化方法 |
CN103354928A (zh) * | 2012-02-03 | 2013-10-16 | 日本电气株式会社 | 多维度数据可视化设备、方法和程序 |
-
2015
- 2015-04-10 CN CN201510167946.1A patent/CN104750847B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110175905A1 (en) * | 2010-01-15 | 2011-07-21 | American Propertunity, LLC. | Infoshape: displaying multidimensional information |
CN102332056A (zh) * | 2011-09-27 | 2012-01-25 | 浙江工业大学 | 基于信息可视化技术的房产数据可视化系统 |
CN102609507A (zh) * | 2012-02-03 | 2012-07-25 | 浙江工业大学 | 基于Web的数据可视化系统 |
CN103354928A (zh) * | 2012-02-03 | 2013-10-16 | 日本电气株式会社 | 多维度数据可视化设备、方法和程序 |
CN102855662A (zh) * | 2012-07-25 | 2013-01-02 | 中国科学院对地观测与数字地球科学中心 | 海洋环境的可视化方法 |
Non-Patent Citations (1)
Title |
---|
董军凯: "基于平行坐标法的可视化数据挖掘技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109923535A (zh) * | 2016-11-08 | 2019-06-21 | 微软技术许可有限责任公司 | 作为便携式用户应用对象的洞察对象 |
CN109923535B (zh) * | 2016-11-08 | 2023-07-18 | 微软技术许可有限责任公司 | 作为便携式用户应用对象的洞察对象 |
CN108304500A (zh) * | 2018-01-17 | 2018-07-20 | 西南交通大学 | 一种基于类属性的平行坐标可视化曲线绑定方法 |
CN108304500B (zh) * | 2018-01-17 | 2020-06-02 | 西南交通大学 | 一种基于类属性的平行坐标可视化曲线绑定方法 |
CN111158699A (zh) * | 2019-12-31 | 2020-05-15 | 青岛海尔科技有限公司 | 基于Apriori算法的应用优化方法、装置和智能设备 |
CN112232591A (zh) * | 2020-11-02 | 2021-01-15 | 国网湖南省电力有限公司 | 基于气象因素的覆冰厚度智能预警方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104750847B (zh) | 2018-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guerra-Gomez et al. | Visualizing change over time using dynamic hierarchies: TreeVersity2 and the StemView | |
US10878034B2 (en) | Quantified Euler analysis | |
US9582573B2 (en) | Interactive composite plot for visualizing multi-variable data | |
CN104750847A (zh) | 一种基于动态平行坐标的关联规则可视化系统及方法 | |
CN105760401B (zh) | 基于移动终端的报表数据交互方法和系统 | |
US20140331179A1 (en) | Automated Presentation of Visualized Data | |
US9633392B2 (en) | Integrated finding experience systems and methods | |
CN110363555A (zh) | 基于视线跟踪视觉算法的推荐方法和装置 | |
CN102855413A (zh) | 一种三维服饰试穿系统及其操作方法 | |
US10387444B2 (en) | Tools for auto-visualizations of data | |
US11222039B2 (en) | Methods and systems for visual data manipulation | |
US20170039741A1 (en) | Multi-dimensional visualization | |
US10573036B1 (en) | Concentric data visualization structures | |
US20180067625A1 (en) | Trellis chart scaling | |
CN113010626A (zh) | 一种热力图生成方法、装置、设备和存储介质 | |
JP6054532B2 (ja) | データ視覚化の方法及びシステム | |
CN103136669A (zh) | 基于商品模型库的商品展示方法及商品展示系统 | |
CN106991191A (zh) | 商品筛选方法及装置、存储介质、电子设备 | |
JP2014002678A (ja) | オブジェクト表示方法、プログラム、及び装置 | |
JP2012003579A (ja) | 2次元図表の表示プログラムおよび2次元図表の表示装置 | |
CN103425825A (zh) | 基于cad平面设计图的3d超市展示方法 | |
CN108182596A (zh) | 一种基于大数据环境下企业销售管理方法 | |
CN107562826A (zh) | 一种多维度数据的可视化对比展示方法及其系统 | |
US20170372397A1 (en) | System and method for consumer choice modeling | |
Chegini et al. | Interaction Concepts for Collaborative Visual Analysis of Scatterplots on Large Vertically-Mounted High-Resolution Multi-Touch Displays. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20190528 Address after: 210000 Building No. 2, Changfeng Building, 14 Xinghuo Road, Jiangbei New District, Nanjing City, Jiangsu Province, 13th Floor Patentee after: NANJING DONG HE AUTOMATION ENGINEERING Co.,Ltd. Address before: 211100 No. 8 fo Cheng Xi Road, Jiangning Development Zone, Nanjing, Jiangsu. Patentee before: HOHAI University |
|
TR01 | Transfer of patent right |