CN109885603B - 一种平行坐标可视化边绑定方法 - Google Patents
一种平行坐标可视化边绑定方法 Download PDFInfo
- Publication number
- CN109885603B CN109885603B CN201910026388.5A CN201910026388A CN109885603B CN 109885603 B CN109885603 B CN 109885603B CN 201910026388 A CN201910026388 A CN 201910026388A CN 109885603 B CN109885603 B CN 109885603B
- Authority
- CN
- China
- Prior art keywords
- sample data
- group
- attribute dimension
- attribute
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Generation (AREA)
Abstract
本发明公开了一种平行坐标可视化边绑定方法,包括以下步骤:获取数据集中的样本信息,并对样本全体进行分类;分别计算每个样本类别在各个属性维度下的均值;依据均值设置相邻属性维度之间的虚拟控制轴和平行控制点;将设置好的平行控制点与每个样本数据进行配对;将配对完成的样本数据点与平行控制点进行连接。本发明有效地解决了一般平行坐标可视化边绑定方法中的曲线重叠问题,并且相比于传统的平行坐标可视化,本发明能够明显的降低每个样本类别所占用的视觉空间,达到减少视觉杂乱的目的。
Description
技术领域
本发明涉及信息可视化领域,特别是一种平行坐标可视化边绑定方法。
背景技术
在大数据时代,伴随着互联网、物联网、云计算等信息技术的飞速发展,数据呈现出高维度、大容量的趋势。人们在面对大量的数据时,难以从中获取有价值的信息,从而做出有效的决策。因此,如何在大数据的环境下为人们提供决策支持,已成为当下重要的研究目标。随着可视化技术的不断发展,可视化技术可以通过图形图像和人机交互等方式,方便直观地向人们展示数据背后隐藏的信息。同时,可视化技术也已经在医学、计算机、化学、物理等多个研究领域发挥着重要的作用。
高维数据是具有多个维度属性的数据,它广泛的存在于各个领域的数据中。可视化高维数据的关键在于如何将数据的多个维度属性同时在一个视图中展示出来,现在常用的高维数据可视化方法有平行坐标、雷达图和3D视图等。
平行坐标是由Inselberg在1985年提出的一个可视化高维数据的方法。平行坐标可视化首先将数据的各个维度属性依次投影为二维平面中的坐标轴,每条坐标轴的长度相等,并且相互平行。然后将每条数据在各个维度上的数值投影到对应的坐标轴上,并把这些投影的点顺序连接,得到了传统的平行坐标图。平行坐标在对高维数据的可视化中具有表现直观、扩展性好等优点,因此已经成为了高维数据可视化的主要方法。随着平行坐标中数据样本容量的不断增大,在平行坐标可视化视图中会出现大量的曲线交叉、重叠等杂乱现象,严重时曲线将布满整个平行坐标空间,用户将无法从平行坐标可视化中获取到有用的信息,使得可视化方法失去原本的作用。
边绑定是一种解决平行坐标视觉杂乱的方法,它将具有相似属性的曲线相互拉近,从而减少曲线所占用的视觉空间,达到减少视觉杂乱,提高数据曲线辨识度的目的。国内外许多学者都对该方法进行了研究,但是大多数平行坐标边绑定方法使得绑定后的平行坐标中大量曲线发生重叠,这使得虽然绑定后的平行坐标可以直观地观察每个曲线类簇的变化趋势,但是曲线类簇内部则因为大量的重叠而无法对单条曲线进行观察。
发明内容
本发明提出了一种平行坐标可视化边绑定方法,通过设置平行控制点将数据集中同类别样本绘制成束,有效地解决平行坐标可视化在展示大量数据时存在视觉杂乱和曲线重叠的问题。
实现本发明目的的技术方案如下:
一种平行坐标可视化边绑定方法,包括:
步骤1:输入数据集D={di|i=1,2,…,s},其中di为样本数据;样本数据di的属性维度集合为{Wj|j=1,2,…,n},其中Wj为样本数据di的非类别属性维度;
步骤2:若样本数据di的属性维度中还包含类别属性则按照类别属性对数据集D进行分类,否则采用K均值聚类方法对数据集D进行分类;分类后的数据集D={Dk|k=1,2,…,m},m为分类数;其中, 为Dk中的样本数据,l为Dk中的样本数据数量;
步骤4:设定虚拟绑定轴及控制点组,具体步骤如下:
步骤4.2:连接Dk在属性维度Wj与Wj+1上的两个均值点及连接后与虚拟绑定轴A1、A2、A3、A4依次相交于四个点CPA1、CPA2、CPA3、CPA4,这四个交点即为Dk在属性维度Wj与Wj+1上的第一组控制点;
步骤4.3:根据Dk中的样本数据数量l,依次向第一组控制点的上下两侧设定总数为l-1组的等距平行控制点,每组控制点间的距离为ΔCP,由此设定了l组控制点,最上方的控制点组为最下方的控制点组为其中,第p组控制点为
步骤5:将Dk在属性维度Wj与Wj+1上的l组样本数据与其l组控制点进行配对,具体步骤如下:
步骤5.1:将属性维度Wj与Wj+1上的l组样本数据按照属性维度Wj上的数值从大到小排序,若属性维度Wj上的样本数据有两个或者两个以上等值的情况时,则按照其在属性维度Wj+1上的数值从大到小排序,排序后的l组样本数据记为其中q=1,2,…,l;
步骤6:将Dk中配对后的l组样本数据组进行连接,得到Dk在属性维度Wj与Wj+1之间的边绑定曲线,具体步骤如下:
步骤7:按照步骤4至步骤6相同的方法,依次在n-1个相邻属性维度的轴间绘制Dk的边绑定曲线,并将得到的曲线连接起来即获得Dk的边绑定曲线;
步骤8:对D={Dk|k=1,2,…,m}中每一个Dk执行步骤4至步骤7,得到数据集D的平行坐标边绑定视图。
与现有技术相比,本发明的积极效果是:
一、区别传统平行坐标可视化,本发明有效降低了可视化的视觉杂乱程度。
传统的平行坐标可视化方法直接将数据在各个属性维度上的坐标点依次连接,这样的方法容易出现各个维度属性间的直线相互交叉和重叠,并且数据量越大,交叉和重叠的现象就越严重,并且所占用的视觉空间也越大。本发明通过将相同类别的样本进行边绑定成束,减少了同一类别样本曲线所占用的视觉空间,从而达到了降低了平行坐标可视化视觉杂乱程度的目的。
二、区别一般的平行坐标可视化边绑定方法,本发明保证了边绑定方法能够展示曲线类簇的变化趋势,同时有效地解决了边绑定后曲线中部的重叠问题。
现在大多数的平行坐标边绑定方法在轴间曲线中部存在大量的曲线重叠现象,使得用户无法观察到每一条曲线的变化情况,从而丢失了许多原有的平行坐标可视化信息。本发明通过设定平行控制点组的方法,保证了轴间曲线中部不会发生重叠现象,有助于用户观察追踪平行坐标中的每一条曲线数据,同时边绑定之后的曲线类簇也能够同其他边绑定方法一样展示其变化趋势。
附图说明
图1是平行坐标虚拟绑定轴的示意图。
图2是平行坐标第一组控制点的示意图。
图3是平行坐标所有控制点的示意图。
图4是出现多余交叉点情况的示意图。
图5是数据点与控制点组配对示意图。
图6是数据点与控制点组连接示意图。
图7是传统平行坐标边绑定的效果图。
图8是本发明提出的平行坐标边绑定效果图。
图9是传统平行坐标可视化在seeds数据集下的效果图。
图10是本文提出的平行坐标边绑定在seeds数据集下的效果图。
具体实施方式
具体实施步骤如下所示:
步骤1:输入数据集D={di|i=1,2,…,s},其中di为样本数据;样本数据di的属性维度集合为{Wj|j=1,2,…,n},其中Wj为样本数据di的非类别属性维度;
步骤2:若样本数据di的属性维度中还包含类别属性则按照类别属性对数据集D进行分类,否则采用K均值聚类方法对数据集D进行分类;分类后的数据集D={Dk|k=1,2,…,m},m为分类数;其中, 为Dk中的样本数据,l为Dk中的样本数据数量;
步骤4:设定虚拟绑定轴及控制点组,具体步骤如下:
步骤4.3:根据Dk中的样本数据数量l,依次向第一组控制点的上下两侧设定总数为l-1组的等距平行控制点,如图3所示,每组控制点间的距离为ΔCP,由此设定了l组控制点,最上方的控制点组为最下方的控制点组为 其中,第p组控制点为
步骤5:将Dk在属性维度Wj与Wj+1上的l组样本数据与其l组控制点进行配对,具体步骤如下:
步骤5.1:将属性维度Wj与Wj+1上的l组样本数据按照属性维度Wj上的数值从大到小排序,若属性维度Wj上的样本数据有两个或者两个以上等值的情况时,则按照其在属性维度Wj+1上的数值从大到小排序,排序后的l组样本数据记为其中q=1,2,…,l;在属性维度Wj上的数据有等值情况按照其在属性维度Wj+1上的数值进行排序,是为了在边绑定后避免出现多余的交叉点,如图4所示;
步骤6:将Dk中配对后的l组样本数据组进行连接,得到Dk在属性维度Wj与Wj+1之间的边绑定曲线,如图6所示,具体步骤如下:
步骤7:按照步骤4至步骤6相同的方法,依次在n-1个相邻属性维度的轴间绘制Dk的边绑定曲线,并将得到的曲线连接起来即获得Dk的边绑定曲线;
步骤8:对D={Dk|k=1,2,…,m}中每一个Dk执行步骤4至步骤7,得到数据集D的平行坐标边绑定视图。
本发明设计了一种平行坐标可视化边绑定方法,先对样本全体进行分类,然后通过计算得到每个样本类别在各个属性维度下的均值,并根据均值点设置虚拟绑定轴和平行控制点。最后将平行控制点与样本的每一组数据进行配对和连接,从而达到减小同一类别的样本曲线占用较大视觉空间的问题。同时,也有效地解决了一般边绑定方法造成的曲线类簇中部的曲线重叠问题,便于用户追踪每一条曲线的变化趋势。
为验证本发明的有效性,本发明设计了两个对比试验,试验一为本发明与现有的平行坐标边绑定方法的对比实验。试验二为本发明与传统平行坐标可视化方法的对比实验。
试验一
本试验将本发明的方法与现有的基于类属性的平行坐标可视化边绑定方法作对比,数据集采用的是Iris数据集。如图7,为基于类属性的平行坐标可视化边绑定效果图,该平行坐标边绑定方法通过设置绑定控制点和中心吸引系数,将同一类别的数据收束成束,以此达到了减少视觉杂乱的效果。该方法虽然可以有效地减少传统平行坐标的视觉杂乱问题,但是经过边绑定后的曲线类簇中部曲线产生重叠,使得边绑定后的平行坐标图只能用于观察Iris数据集三个曲线类簇的变化趋势,用户无法追踪每条曲线的变化情况,这造成了原本的平行坐标可视化的数据信息产生了大量的丢失。本发明提出了基于平行控制点的平行坐标可视化边绑定方法,边绑定效果图如图8所示。本方法对比一般平行坐标边绑定方法,在绑定后的曲线类簇中部,所有的曲线都是平行并与其他曲线距离间隔,从而有效地解决了绑定后的曲线重叠问题,极大程度上保留了原始平行坐标可视化表达的数据信息。
试验二
本试验将本发明的方法与传统的平行坐标可视化方法作对比,数据集采用的是seeds数据集。如图9,为传统的平行坐标可视化边效果图,传统的平行坐标可视化在展示的数据量较大的情况时,每个样本类别的曲线都会占用较大的视觉空间,从而造成视觉杂乱问题。如图10,为本发明的平行坐标可视化边绑定效果图,本方法对比传统的平行坐标边可视化方法,同一样本类别的曲线相互靠近,以此减少了每个样本类别所占用的视觉空间,从而到达了减少视觉杂乱的效果,使得用户能够更直观的观察每个样本类别数据在不同属性维度下的变化趋势。
Claims (1)
1.一种平行坐标可视化边绑定方法,其特征在于,包括:
步骤1:输入数据集D={di|i=1,2,…,s},其中di为样本数据;样本数据di的属性维度集合为{Wj|j=1,2,…,n},其中Wj为样本数据di的非类别属性维度;
步骤2:若样本数据di的属性维度中还包含类别属性则按照类别属性对数据集D进行分类,否则采用K均值聚类方法对数据集D进行分类;分类后的数据集D={Dk|k=1,2,…,m},m为分类数;其中, 为Dk中的样本数据,l为Dk中的样本数据数量;
步骤4:设定虚拟绑定轴及控制点组,具体步骤如下:
步骤4.3:根据Dk中的样本数据数量l,依次向第一组控制点的上下两侧设定总数为l-1组的等距平行控制点,每组控制点间的距离为ΔCP,由此设定了l组控制点,最上方的控制点组为最下方的控制点组为其中,第p组控制点为
步骤5:将Dk在属性维度Wj与Wj+1上的l组样本数据与其l组控制点进行配对,具体步骤如下:
步骤5.1:将属性维度Wj与Wj+1上的l组样本数据按照属性维度Wj上的数值从大到小排序,若属性维度Wj上的样本数据有两个或者两个以上等值的情况时,则按照其在属性维度Wj+1上的数值从大到小排序,排序后的l组样本数据记为其中q=1,2,…,l;
步骤6:将Dk中配对后的l组样本数据组进行连接,得到Dk在属性维度Wj与Wj+1之间的边绑定曲线,具体步骤如下:
步骤7:按照步骤4至步骤6相同的方法,依次在n-1个相邻属性维度的轴间绘制Dk的边绑定曲线,并将得到的曲线连接起来即获得Dk的边绑定曲线;
步骤8:对D={Dk|k=1,2,…,m}中每一个Dk执行步骤4至步骤7,得到数据集D的平行坐标边绑定视图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910026388.5A CN109885603B (zh) | 2019-01-11 | 2019-01-11 | 一种平行坐标可视化边绑定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910026388.5A CN109885603B (zh) | 2019-01-11 | 2019-01-11 | 一种平行坐标可视化边绑定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109885603A CN109885603A (zh) | 2019-06-14 |
CN109885603B true CN109885603B (zh) | 2022-08-26 |
Family
ID=66925960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910026388.5A Active CN109885603B (zh) | 2019-01-11 | 2019-01-11 | 一种平行坐标可视化边绑定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109885603B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110598052B (zh) * | 2019-07-25 | 2023-02-03 | 中山大学 | 一种交通期望线的边绑定以及评价方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1094422A2 (en) * | 1999-10-21 | 2001-04-25 | International Business Machines Corporation | Systems and methods for ordering categorical attributes to better visualize multidimensional data |
CN105404643A (zh) * | 2015-10-27 | 2016-03-16 | 北京工商大学 | 针对具有多维属性的层次结构数据的可视化方法和应用 |
CN106709507A (zh) * | 2016-11-29 | 2017-05-24 | 北京林业大学 | 一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法 |
CN106874349A (zh) * | 2016-12-26 | 2017-06-20 | 深圳市位和科技有限责任公司 | 基于交互可视化的多维数据分析方法及系统 |
CN108304500A (zh) * | 2018-01-17 | 2018-07-20 | 西南交通大学 | 一种基于类属性的平行坐标可视化曲线绑定方法 |
CN108319569A (zh) * | 2018-01-17 | 2018-07-24 | 西南交通大学 | 一种基于维度重排序降低平行坐标可视化视觉杂乱的方法 |
CN108628957A (zh) * | 2018-04-13 | 2018-10-09 | 西南交通大学 | 一种基于时间区间的螺旋图可视化曲线绑定方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9153051B2 (en) * | 2013-03-01 | 2015-10-06 | Business Objects Software Limited | Visualization of parallel co-ordinates |
-
2019
- 2019-01-11 CN CN201910026388.5A patent/CN109885603B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1094422A2 (en) * | 1999-10-21 | 2001-04-25 | International Business Machines Corporation | Systems and methods for ordering categorical attributes to better visualize multidimensional data |
CN105404643A (zh) * | 2015-10-27 | 2016-03-16 | 北京工商大学 | 针对具有多维属性的层次结构数据的可视化方法和应用 |
CN106709507A (zh) * | 2016-11-29 | 2017-05-24 | 北京林业大学 | 一种力导向分段骨骼的平行坐标系视图聚类数据绑定方法 |
CN106874349A (zh) * | 2016-12-26 | 2017-06-20 | 深圳市位和科技有限责任公司 | 基于交互可视化的多维数据分析方法及系统 |
CN108304500A (zh) * | 2018-01-17 | 2018-07-20 | 西南交通大学 | 一种基于类属性的平行坐标可视化曲线绑定方法 |
CN108319569A (zh) * | 2018-01-17 | 2018-07-24 | 西南交通大学 | 一种基于维度重排序降低平行坐标可视化视觉杂乱的方法 |
CN108628957A (zh) * | 2018-04-13 | 2018-10-09 | 西南交通大学 | 一种基于时间区间的螺旋图可视化曲线绑定方法 |
Non-Patent Citations (5)
Title |
---|
A Visual Representation of Clusters Characteristics Using Edge Bundling for Parallel Coordinates;Rodrigo S.A. Divino et al;《2017 21st International Conference Information Visualisation (IV)》;20171116;90-95 * |
An Edge-Bundling Layout for Interactive Parallel Coordinates;Gregorio Palmas et al;《2014 IEEE Pacific Visualization Symposium》;20140414;57-64 * |
基于平行坐标的信息可视化方法的应用研究;谭桂龙 等;《北京工商大学学报(自然科学版)》;20080315(第02期);75-80 * |
基于聚类的边绑定算法研究;杨豪斌;《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》;20170515;I138-696 * |
平行坐标中的边捆绑算法;秦红星 等;《计算机辅助设计与图形学学报》;20170715;第29卷(第07期);1235-1244 * |
Also Published As
Publication number | Publication date |
---|---|
CN109885603A (zh) | 2019-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chan | A survey on multivariate data visualization | |
Im et al. | GPLOM: the generalized plot matrix for visualizing multidimensional multivariate data | |
US10855564B2 (en) | Visualization of network data as a three-dimensional hierarchical data structure in a mixed reality environment | |
Dunne et al. | Improving graph drawing readability by incorporating readability metrics: A software tool for network analysts | |
CN106055580B (zh) | 一种基于Radviz的模糊聚类结果可视化方法 | |
Martins et al. | Multidimensional projections for visual analysis of social networks | |
US8610743B2 (en) | Systems and methods for displaying, viewing and navigating three dimensional representations | |
Nakazawa et al. | A visualization of research papers based on the topics and citation network | |
CN109885603B (zh) | 一种平行坐标可视化边绑定方法 | |
US10318545B1 (en) | Dataset visualization system and method | |
CN108319569A (zh) | 一种基于维度重排序降低平行坐标可视化视觉杂乱的方法 | |
Bok et al. | Augmenting parallel coordinates plots with color-coded stacked histograms | |
Makwana et al. | Axes re-ordering in parallel coordinate for pattern optimization | |
CN107392249A (zh) | 一种k近邻相似度优化的密度峰聚类方法 | |
Lim | Transfer learning by borrowing examples for multiclass object detection | |
CN106021529A (zh) | 一种基于平行坐标系的海量文件流转可视化方法 | |
CN108304500B (zh) | 一种基于类属性的平行坐标可视化曲线绑定方法 | |
Carmichael et al. | CloseViz: visualizing useful patterns | |
CN107402986B (zh) | 一种多维度数据的可视化展示方法及系统 | |
Susmaga et al. | Visualization support for the analysis of properties of interestingness measures | |
Kubota et al. | EVOLVE: A visualization tool for multi-objective optimization featuring linked view of explanatory variables and objective functions | |
Itoh et al. | Multidimensional data visualization applying a variety-oriented scatterplot selection technique | |
De Oliveira et al. | Hybrid visualization: a new approach to display instances relationship and attributes behaviour in a single view | |
Cui et al. | Confluent-drawing parallel coordinates: Web-based interactive visual analytics of large multi-dimensional data | |
Kumar et al. | Clutter reduction in parallel coordinates using binning approach for improved visualization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |