CN104899288A - 基于径向布局的多维层次可视化方法 - Google Patents

基于径向布局的多维层次可视化方法 Download PDF

Info

Publication number
CN104899288A
CN104899288A CN201510305090.XA CN201510305090A CN104899288A CN 104899288 A CN104899288 A CN 104899288A CN 201510305090 A CN201510305090 A CN 201510305090A CN 104899288 A CN104899288 A CN 104899288A
Authority
CN
China
Prior art keywords
node
data
child
dimension
pnode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510305090.XA
Other languages
English (en)
Other versions
CN104899288B (zh
Inventor
朱敏
唐彬彬
刘汉清
苏亚博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN201510305090.XA priority Critical patent/CN104899288B/zh
Publication of CN104899288A publication Critical patent/CN104899288A/zh
Application granted granted Critical
Publication of CN104899288B publication Critical patent/CN104899288B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种基于径向布局的多维层次可视化方法,即定义多维层次视图的绘制算法,包括三个部分:一、径向层次视图的绘制算法,给定父节点pNode的第i+1个孩子节点childi+1∈Tm,该节点在视图中的绘制为:二、圆形平行坐标绘制算法,对于给定数据集Um×n,其中的n维数据点映射为二维空间上的一条圆形折线段;三、视图融合,借助镂空设计策略Holow Spiral Model实现多维层次视图的无缝融合,Detail Outside交互设计实现对视图的联动分析。本发明保持了较高空间利用率和较好伸缩性,同时维持了布局的全局径向性,实现多维层次视图的无缝融合。

Description

基于径向布局的多维层次可视化方法
技术领域
本发明涉及多维和层次可视化技术领域,特别涉及一种基于径向布局的多维层次可视化方法。
背景技术
多维层次数据是同时具有多维特性和层次特性的一类数据。多维性是指每个数据对象具有两个或两个以上独立或者相关属性,如电脑的配置信息,CPU、内存、硬盘等参数,每个参数描述电脑的一个属性。层次性表现为两类,包含和从属,如地理位置分布和社会组织架构。此类数据广泛存在于人们的日常社会生产中,如购物网站中的商品分类、国家统计局发布的全国各省市统计年鉴、包含地理信息的气象数据、社交网络数据等,且该数据中蕴含了丰富的信息。随着移动互联网时代的到来,真实世界与虚拟世界已经变得密不可分,信息的产生和流动瞬息万变,呈现、理解和应用此类新型的海量复杂数据已然成为数据可视化与分析面临的新挑战。
可视化技术是一种利用人眼感知能力对数据进行交互的可视表达以增强认知的技术。它将数据转化为可感知的图形、符号、颜色、纹理等,来增强数据识别效率,传递有效信息。由于可视化技术的直观与高效,越来越广泛地被应用到科学研究与实际应用中。目前的探索和分析方法主要针对该类数据的单个特性,即高维可视化和层次可视化。而同时兼顾多维和层次特性的可视化方法较少,且在展示粒度上存在局限性。
多维可视化作为可视化领域的一个重要分支,通过数据处理,如特征提取和降维,及图形映射,反映多维信息及其各属性之间的关系,实现在低维可视空间中展示多维抽象信息的多属性数据特征。目前多维可视化的研究较为成熟,针对高维数据的可视化方法较多,如平行坐标、散点图矩阵、VHDR等,这些方法主要是对数据的多维特性进行分析,对同时具有层次特性的数据而言,会丢失其层次结构。此外,由于这些方法本身的特点,使得其对布局空间较敏感且可伸缩性较低。
层次可视化作为信息可视化的另一个重要分支,其主要目标是对数据中的层次关系进行有效刻画。可视化中,采用不同的视觉符号表示不同类型关系决定了层次可视化的两种主要类别:节点-链接和空间填充。在表达数据层次信息时,前者的缺点在于随着层次和节点数的增加会引起广度和深度的过度扩展,导致可读性较差,且大量数据点聚集在屏幕局部范围,难以高效利用有限的屏幕空间;后者具有高效的空间利用率,但在表达层次信息上没有前者清晰。
已有的多维层次可视化方法,如Treemap在展示层次信息的同时使用视网膜变量(如颜 色,形状,大小,标签等)来表示维度信息,然而该方法存在维度可扩展性弱的缺点;融合多维和层次视图的复合可视化方法分别使用层次视图和多维视图来展示数据的层次结构和多维信息,其缺点是需要用户在多个视图和全局视图间维持视觉平衡,且多个视图间的切换可能导致用户丢失全局上下文信息。
以上提到的可视化技术在对多维层次数据进行展现时主要存在问题有:1)仅仅针对原始数据的单个特征层面进行分析和探索;2)对维度增长敏感,较低的可伸缩性,且容易造成用户丢失全局上下文信息。
发明内容
本发明所要解决的技术问题是提供一种基于径向布局的多维层次可视化方法,设计多维层次视图对数据进行展示。
为解决上述技术问题,本发明采用的技术方案如下:
一种基于径向布局的多维层次可视化方法,包括径向层次视图的绘制算法、圆形平行坐标绘制算法、视图融合三个部分;
径向层次视图的绘制算法:给定父节点pNode的第i+1个孩子节点childi+1∈Tm,Tm为树结构,下标m表示节点数,该节点在视图中的绘制为:
rStep = pNode . outerRadius - pNode . innerRadius child i + 1 . outerRadius = pNode . outerRadius + rStep child i + 1 . innerRadius = pNode . innerRadius + rSrep child i + 1 . startAngle = pNode . startAngle + child i + 1 . endAngle child i + 1 . endAngle = child i + 1 . startAngle + child i + 1 . arcWidth child i + 1 . arcWidth = pNode . arcWidth &times; child i + 1 . leafCount pNode . leafCount , 孩子节点childi+1对应视图中的扇形块Widget,每个扇形块由<innerRadius,outerRadius,startAngle,endAngle>四元组唯一确定;rStep表示每个节点对应的扇形块的径向宽度,由该节点的内半径innerRadius和外半径outerRadius决定,节点childi+1的起始角度startAngle等于父节点pNode起始角度加上节点ci的结束角度endAngle;节点跨度arcWidth由以该节点为根节点的子树的叶子节点数占原始树的总的叶子节点数的比例;
圆形平行坐标绘制算法:对于给定数据集Um×n,其中的n维数据点映射为二维空间上的一条圆形折线段,其映射函数定义为:
其中vij(x,y)表示轴Xl第i条 折线段与轴的交点,其坐标由 x = rLocation &times; cos &theta; y = rLocation &times; sin &theta; rLocation = r in + u ij - uMin j uMax j - uMin j &times; ( r out - r in ) 进行计算,uMaxj,uMinj表示第j个维度上的最大值和最小值,(x,y)为节点vij(x,y)在圆形平行坐标中相应轴上的坐标值,θ由计算获得;
视图融合:借助镂空设计策略Holow Spiral Model实现多维层次视图的无缝融合,Detail Outside交互设计实现对视图的联动分析。
根据上述方法,还包括定义多维层次数据的数据结构和对原始数据进行抽取、预处理生成预定义数据结构的数据两个步骤;
定义多维层次数据的数据结构:设共包含m条数据记录且具有n个数据维度的原始数据集表示为矩阵Um×n,定义为其中,表示第i条数据记录,uij表示第i条数据记录的第j个属性值,相应的潜在层次结构表示为Tm=<V,E>,定义为 T m = &lang; V , E &rang; : V = { v 1 , v 2 , . . . , v | V | } E = { e 1 , e 2 , . . . , e | E | } | V | = | E | + 1 | V | = m Tm是连通图,树中的每个节点node定义为:
V={v1,v2,…,v|V|}表示节点集,对应原始数据集的条目,E={e1,e2,…,e|E|}表示数据中隐含的包含或从属关系,attrs为节点属性集,children表示子节点集,三元组表示一个节点或一条折线段,即多维层次数据结构定义为D={<u,t>|u∈Um×n,t∈Tm};
对原始数据进行抽取、预处理生成预定义数据结构的数据:首先对原始数据集进行异常值处理,异常值包括空条目、数据类型错误,具体为,遍历每条记录,对其中存在的异常属性值按照不同的异常情况进行不同的处理,数值空条目进行零值填充,数据类型错误进行类型转换,根据该条目数据取平均或最值处理;再对预处理后的数据进行数据抽取,具体为,遍历数据集中的每条记录,记录由基本属性字段和特征字段组成,对于该记录生成与之对应的节点node,基本属性字段对应节点node中的atts属性集,而特征字段生成为:
每个uij对应该特征维度上的取值,同时根据数据中的组织结构或地理信息获取节点间的从属关系,得到由节点组成的节点集, 即为隐藏的生成树模型,根节点即为无父节点的节点,表示为:获得可绘制的单个数据元素VisualItem;最后递归地对VisualItem进行绘制。
根据上述方法,还包括借助Colorbrewer使用颜色放射渐变的方法,同时修改色调和透明度对每层节点进行着色,通过透明度加添加剂的设计方法使得满足筛选条件的节点或折线簇的辨识度提高。
根据上述方法,还包括提供用户交互的接口,允许用户定制筛选规则,辅助用户从多角度多层次地探索和分析数据以发现潜在的知识和模式。
与现有技术相比,本发明的有益效果是通过对原始数据中存在的多维信息和层次结构进行抽取和预处理生成多维层次数据结构,并设计多维层次视图对数据进行展示,该可视化方法保持了较高空间利用率和较好伸缩性,同时也维持了布局的全局径向性,实现多维层次视图的无缝融合。
附图说明
图1是本发明基于径向布局的多维层次可视化方法的整体系统概览图。
图2是本发明基于径向布局的多维层次可视化方法的多维层次视图。
图3是本发明基于径向布局的多维层次可视化方法的交互操作展示图。
图4是本发明基于径向布局的多维层次可视化方法的层次结构设计图。
图5是本发明基于径向布局的多维层次可视化方法的多维结构设计图。
图6是本发明基于径向布局的多维层次可视化方法的视图融合与交互之展示图一。
图7是本发明基于径向布局的多维层次可视化方法的视图融合与交互之展示图二。
图8是本发明基于径向布局的多维层次可视化方法的视图融合与交互之展示图三。
图9是本发明基于径向布局的多维层次可视化方法的使用颜色放射渐变效果图。
图10是对本发明方法进行进行具体实例验证之结果图一。
图11是对本发明方法进行进行具体实例验证之结果图二。
图12是对本发明方法进行进行具体实例验证之结果图三。
图13是对本发明方法进行进行具体实例验证之结果图四。
图14是对本发明方法进行进行具体实例验证之结果图五。
图15是对本发明方法进行进行具体实例验证之结果图六。
图16是本发明基于径向布局的多维层次可视化方法的实现流程示意图。
具体实施方式
本发明的目的是提供一种基于径向布局的多维层次可视化方法,主要是多维层次视图的绘制算法,还包括多维层次数据结构的定义与抽取、以及保持局部和全局上下文信息的交互 设计,包括3大步骤。
(1)多维层次数据结构的定义与抽取
由于搜集的原始数据大都以条目的形式保存,数据中本身包含的多维属性和层次特性表现不明显,故需要对其进行数据结构的抽取。设原始数据集Um×n包含m条记录 i∈[0,m)表示记录的索引值,j∈[0,n)表示每条记录的第j个特征项的索引值,uij表示第i条记录的第j个特征项。通过上述步骤抽取得到数据条目的多维属性,而原始数据的层次结构根据其所隐含的组织结构或地理信息等定义为树结构,同样,对于数据集Um×n,定义层次树Tm=<V,E>,数据记录映射为树结构中的节点集V,数据记录间潜在的包含或从属关系集对应树结构中的边集E。最终可以得到,原始数据的数据结构定义为D={<u,t>|u∈Um×n,t∈Tm}。至此,完成对多维层次数据结构的定义和抽取。
(2)多维层次视图的绘制算法
多维层次视图的绘制算法包括三个部分:径向层次视图的绘制算法、圆形平行坐标绘制算法和视图融合。其优势在于:①保持整体视图的全局径向性,充分利用有限的屏幕空间,使得在维度或层次扩展的同时具有较好的伸缩性;②采用镂空的设计策略,实现径向层次视图和圆形平行坐标的无缝融合,方便用户在交互探索时维持全局和局部的上下文信息。
1)径向层次视图绘制算法:对于树结构Tm=<V,E>,采用径向填充算法进行绘制,其中采用扇形块,如下式:
Widget∝
{(innerRadius,outerRadius,startAngle,endAngle)|innerRadius,outerRadius>0∧0°≤startAngle,endAngle≤360°}此公式表示层次结构中的节点。每个节点对应的扇形块Widget由对应的四元组唯一确定,其中innerRadius,outerRadius分别表示其内外半径,startAngle,endAngle表示沿顺时针方向扇形块的起始和终止角度。父子节点之间的层次关系使用Widget之间的相互嵌套隐喻来表达,如图2所示,即孩子节点绘制于其父节点所占有的扇形区域内,而每个节点所对应的Widget角度跨度对应其所包含所有子孙节点中叶子节点占总的叶子节点的比例,即表示为式中childi.leafCount表示第i个子节点的节点数目,pNode.leafCount表示其父节点所含子节点数目,而pNode.arcWidth表示父节点的Widget角度跨度。当层次增加时,为了更好地识别每个层次的节点,使用颜色放射渐变的策略提供直观有序的视觉效果。
2)圆形平行坐标绘制算法:传统的平行坐标在二维空间中采用等距离的、竖直的k条平行坐标轴表示k维空间,每条轴线对应一个属性维度,坐标轴的取值范围可根据数据自定义映 射关系,k维空间的数据点对应平行坐标上的折线段。然而该方法随着维度的增加对屏幕大小敏感,为了提高空间利用率和保持整体视图的全局径向性,提出圆形平行坐标绘制算法。其主要思想为:在二维空间中采用圆形布局的策略使用k条射线轴表示k维空间,同时为了融合径向层次视图,每个坐标轴的起始位置开始于半径为rin的圆环,终点放置于半径为rout的圆环上。坐标轴Xl(l=1,…,k)顺时针依次部署于圆环上,每个k维数据点Pi=(pi0,pi1,..,pik-1)(其中Pij表示k维空间中第j个分量)映射为一条圆形折线段 其中vij表示第j,j∈[0,k-1]条的数据点,表示轴k-2与k-1之间的折线。
3)视图融合:经过上述两步分别生成了表示层次信息的径向层次视图和表示多维信息的圆形平行坐标,该视图均满足全局径向性。由于圆形平行坐标采用中间镂空的设计策略Holow Spiral Model,故将径向层次视图绘制于镂空区域以实现两视图的无缝融合,径向层次视图的最外层圆环半径TouterRadius略大于圆形平行坐标内圆环半径CinnerRadius
(3)保持局部和全局上下文信息的交互设计:在该步骤中,采用Detail Outside策略设计Multi-focus+context交互式视图,使用户可以同时分析多维层次视图的多个区域。当视图中的折线或节点获得焦点后,将会生成一棵以该当前节点为根的子树SubTree,其数据结构与整体视图的数据结构一致。新生成的SubTree向外扩张,其根节点对应外圈新生成的圆环,而SubTree的子孙节点仍然和整体视图相同的布局算法依次向外层布局,原先的整体视图向内中心镂空区域收缩,保持多维层次视图的全局径向性。此时生成的视图包含有全局信息,也含有局部上下文信息,提供用户多视角多层次的分析需求,如图3所示。
结合上述可视化方法的主要设计思路,本发明基于径向布局的多维层次可视化方法具体实现过程详述如下。
步骤1:定义多维层次数据的数据结构
设共包含m条数据记录且具有n个数据维度(属性字段或数据特征)的原始数据集可表示为矩阵Um×n,定义为其中, 表示第i条数据条目,uij表示第i条记录的第j个属性值。相应的潜在层次结构可表示为 T m = < V , E > , T m = < V , E > : V = { v 1 , v 2 , . . . , v | V | } E = { e 1 , e 2 , . . , e | E | } | V | = | E | + 1 | V | = m , Tm是连通图,树中的每个节点节点node定义为:
V={v1,v2,…,v|V|}表示节点集,对应原始数据集的条目,E={e1,e2,…,e|E|}表示数据中隐含的包含或从属关系,attrs为节点属性集,children表示子节点集,三元组表示一个节点或一条折线段。至此,由多维层次数据结构可定义为:D={<u,t>|u∈Um×n,t∈Tm}。
步骤2:对原始数据进行抽取、预处理生成预定义数据结构的数据
定义后的数据为抽象数据,无布局信息,对应某一节点或折线段无坐标、颜色、尺寸、标签等信息,只含有数据的基本信息,并对该数据进行布局渲染生成可绘制数据元素VisualItem。此设计为一种可视化框架,优势在于在可视化过程中保存数据的原始结构信息,同时为多个可视化模型提供基础数据模型(base data model),这使得多个特定的可视化模型共享原始数据结构信息而又相互独立(模式-视图-控制器模式),用户执行的交互操作只针对与其对等的可绘制元素VisualItem。
对原始数据集进行异常值处理,如空条目、数据类型错误等。首先遍历每条记录,对其中存在的异常属性值按照不同的异常情况进行不同的处理,如数值空条目,由于没有历史数据进行零值填充;数据类型错误进行类型转换,有可能数值不符合要求,根据该条目数据取平均或最值处理。
对预处理后的数据进行数据抽取,具体为,遍历数据集中的每条记录,其由基本属性字段(如记录的标识、名称、从属信息等)和特征字段(即为要展示分析的维度)组成,对该记录生成与之对应的节点node,基本属性字段对应节点node中的atts属性集,而特征字段生成为其中每个uij对应该特征维度上的取值,同时根据数据中的组织结构或地理信息等获取节点间的从属关系,如遍历节点node其地理名称为“成都市”,其为节点“四川”的管辖城市,故找到节点parent其name属性为“四川”,添加node的节点为其子节点,即parent.addChild(node),得到由节点组成的节点集,即为隐藏的生成树模型,根节点即为无父节点的节点,表示为:然后对处理后的数据进行特征选取,该可视化方法中需要对数据的多维属性进行可视分析,一般来讲,对于交互式设计,维度过高,容易使得绘制的视图中出现聚簇,造成视觉混乱,对维度数较少(≤12),可结合已有的知识背景或经验进行选取,或全部进行绘制,而对于维度较高(>12),由于屏幕空间的限制无法全部绘制出来,此时提供用户对维度的可控,如选取若干维度进行展示并分析,同时采用降维技术(PCA)对数据进行降维,从而完成维度信息的提取。此时数据条目可表示为根据数据潜在的层次结构 如组织架构、地理信息等提取生成树模型:
该模型由下述绘制算法进行布局、渲染,从而获得可绘制的单个数据元素VisualItem,此时的VisualItem具有可绘制的所有信息,如坐标、颜色、标签、尺寸等,且具有数据的原始结构信息如,层次、多维属性等,最后递归的对VisualItem进行绘制。
步骤3:定义多维层次视图的绘制算法,包括径向层次视图的绘制算法、圆形平行坐标绘制算法、视图融合三个部分。具体如下:
1)径向层次视图的绘制算法
给定节点pNode的第i+1个孩子节点childi+1∈Tm,该节点在视图中的绘制为:
rStep = pNode . outerRadius - pNode . innerRadius child i + 1 . outerRadius = pNode . outerRadius + rStep child i + 1 . innerRadius = pNode . innerRadius + rSrep child i + 1 . startAngle = pNode . startAngle + child i + 1 . endAngle child i + 1 . endAngle = child i + 1 . startAngle + child i + 1 . arcWidth child i + 1 . arcWidth = pNode . arcWidth &times; child i + 1 . leafCount pNode . leafCount ,
在此公式中,孩子节点childi+1对应视图中的扇形块Widget,而每个扇形块由<innerRadius,outerRadius,startAngle,endAngle>四元组唯一确定。rStep表示每个节点对应的扇形块的径向宽度,由该节点的内半径innerRadius和外半径outerRadius决定,孩子节点childi+1的起始角度startAngle等于父节点pNode起始角度加上节点ci的结束角度endAngle。节点跨度arcWidth由以该节点为根节点的子树的叶子节点数占原始树的总的叶子节点数的比例,如图4所示。
2)圆形平行坐标绘制算法
对于给定Um×n,其中的n维数据点映射为二维空间上的一条圆形折线段,如图5所示,其映射函数定义为其中,vij(x,y)表示轴Xl第i条折线段与轴的交点,其坐标可由以下定义计算:
x = rLocation &times; cos &theta; y = rLocation &times; sin &theta; rLocation = r in + u ij - uMi n j uMa x j - uMi n j &times; ( r out - r in ) , 式中,uMaxj,uMinj表示第j个维度上的最大值和最小值,得到的(x,y)为节点vij(x,y)在圆形平行坐标中相应轴上的坐标值,θ可由以下公式计算获得: &theta; = &pi; 2 + j &times; 2 &pi; n .
通过以上映射算法,将数据集Um×n从n维空间映射到二维空间,每条记录对应一条折线段Li∈L,整个数据集可由相应的折线段集合表示,即L={Li|0≤i<m}。
3)视图融合
借助镂空设计策略Holow Spiral Model实现多维层次视图的无缝融合,Detail Outside交互设计实现对视图的联动分析。
设计圆形平行坐标时,若n维坐标轴起点为同一圆心,在邻近圆形区域由于空间密集狭窄,对于折线图的绘制会引起视觉上的混乱,故采用镂空思想使圆形平行坐标的中心区域镂空,同时由于其几何特性,使得中心区域满足全局径向性,从而易于层次视图无缝嵌入其中。
当视图中某一折线段或节点获得焦点时,会生成已改当前节点为根节点的子树,并依此向镂空区域的外侧布局,而整体视图则想内侧收缩,并自动填充空白区域,提高空间利用率,同时实现对局部区域的分析,并不丢失全局上下文信息。此外,由于采用径向布局策略,位于下方的坐标轴或节点与人的视觉放下相反,故设计平移、旋转交互操作,使得整个视图的方向可定制,如图6、图7和图8所示。
步骤4:视觉编码 
借助Colorbrewer使用颜色放射渐变的策略,同时修改色调和透明度对每层节点进行着色,提供对每层节点视觉上直观清晰的辨识,此外当折线段过多,易于出现聚簇影响视觉效果,在此通过透明度+添加剂的设计策略使得满足筛选条件的节点或折线簇的辨识度提高。渐变效果如图9所示。
最终,本发明实现的原型系统如图1所示,包括如下几个部分:
(1)多维层次视图(图1中a、b):图1中a为RSF布局的层次视图展示数据层次结构,图1中b为改进的圆形平行坐标表示数据的维度信息,其整体上采用径向布局策略,在具有较高空间利用率的同时保持较好的全局和局部上下文信息。
(2)Colormap(图1中c):该视图用于展示维度信息的数据分布,不同的数据分布值映射为色调和透明度不同的颜色值,采用此策略各个色块之间具有较好的颜色区分度。
(3)用户接口(图1中d):提供用户可交互的接口,允许用户定制筛选规则,辅助用户从多角度多层次的探索和分析数据以发现潜在的知识和模式。
为验证本发明基于径向布局的多维层次可视化方法的实用性和有效性,做如下实例分析。选取来自中国气象局的气象数据为研究对象对本发明基于径向布局的多维层次可视化方法进行验证。气象数据的层次结构表现为全国各省市城市,12个月份或各项气象指标代表该数据的多维信息。从原始数据网站爬取数据,形成的整个数据集由353个层次节点(全国各省、市、县等)及对应12月份的9个气象(极端高温、平均高温、平均温度、平均低温、极端低温、降雨量、相对湿度、平均日降雨量、日照等)。考虑到各气象指标之间的相关性,本实例 中选取了前6个气象指标作为分析对象。
首先,从整体视图的概览图可以观察到,从11月到2月份大部分城市的降雨量相对于其他月份较低,同时各城市的降雨量呈上升趋势,并在7、8、9月达到峰值,然后呈下降趋势,如图10、图11、图12和图13所示。
当观察圆形平行坐标内侧时,如云南普洱、广东的汕头茂名,可以看到这些城市的降雨量在全年呈圆形状,这表示这些城市的降雨量较均匀且量少。此外,在6、7、8月份在多个维度上降雨量呈密集(聚簇)分布,如图14和图15所示。通过过滤和选择操作,发现这些层次在这些月份的降雨量大都集中在80mm与186mm之间,该现象与全国多个区域的降雨量分布一致。
其次,通过本发明所实现的原型系统,可以检测原始数据中的一些异常值。在图图14和图15的右侧,初始时,视图的底部区域有聚簇,还有些离散的折线段,而且其值较大,通过detail on demand和旋转交互操作,选择其中的一条折线段并观察Colormap和Detail视图,发现该城市为海南三亚,它在6月至11月的降雨量分布相对集中,且大致分布于190mm与240mm之间,该分布符合三亚的热带海洋性季风气候特征。同样的,我们观察另一异常值,发现其为广西东兴县,该县的降雨量在4月至11月的分布跨度较大,大致在151.2mm与570.9mm之间,通过在线查阅资料,我们发现东兴县属于亚热带海洋季风气候,符合该区域降雨量的分布特征。

Claims (4)

1.一种基于径向布局的多维层次可视化方法,其特征在于,包括径向层次视图的绘制算法、圆形平行坐标绘制算法、视图融合三个部分;
径向层次视图的绘制算法:给定父节点pNode的第i+1个孩子节点childi+1∈Tm,Tm为树结构,下标m表示节点数,该节点在视图中的绘制为:
rStep = pNode . outerRadius - pNode . innerRadius child i + 1 . outerRadius = pNode . outerRadius + rStep child i + 1 . innerRadius = pNode . innerRadius + rStep child i + 1 . startAngle = pNode . startAngle + child i . endAngle child i + 1 . endAngle = child i + 1 . startAngle + child i + 1 . arcWidth child i + 1 . arcWidth = pNode . arcWidth &times; child i + 1 . leafCount pNode . leafCount , 孩子节点childi+1对应视图中的扇形块Widget,每个扇形块由<innerRadius,outerRadius,startAngle,endAngle>四元组唯一确定;rStep表示每个节点对应的扇形块的径向宽度,由该节点的内半径innerRadius和外半径outerRadius决定,节点childi+1的起始角度startAngle等于父节点pNode起始角度加上节点ci的结束角度endAngle;节点跨度arcWidth由以该节点为根节点的子树的叶子节点数占原始树的总的叶子节点数的比例;
圆形平行坐标绘制算法:对于给定数据集Um×n,其中的n维数据点映射为二维空间上的一条圆形折线段,其映射函数定义为:
其中vij(x,y)表示轴Xl第i条折线段与轴的交点,其坐标由 x = rLocation &times; cos &theta; y = rLocation &times; sin &theta; rLocation = r in + u ij - uMin j uMax j - uMin j &times; ( r out - r in ) 进行计算,uMaxj,uMinj表示第j个维度上的最大值和最小值,(x,y)为节点vij(x,y)在圆形平行坐标中相应轴上的坐标值,θ由计算获得;
视图融合:借助镂空设计策略Holow Spiral Model实现多维层次视图的无缝融合,Detail Outside交互设计实现对视图的联动分析。
2.如权利要求1所述的基于径向布局的多维层次可视化方法,其特征在于,还包括定义多维层次数据的数据结构和对原始数据进行抽取、预处理生成预定义数据结构的数据两个步骤;
定义多维层次数据的数据结构:设共包含m条数据记录且具有n个数据维度的原始数据集表示为矩阵Um×n,定义为其中,表示第i条数据记录,uij表示第i条数据记录的第j个属性值,相应的潜在层次结构表示为Tm=<V,E>,定义为 T m = < V , E > : V = { v 1 , v 2 , . . . , v | V | E = { e 1 , e 2 , . . . , e | E | | V | = | E | + 1 | V | = m , Tm是连通图,树中的每个节点node定义为:
V={v1,v2,…,v|V|}表示节点集,对应原始数据集的条目,E={e1,e2,…,e|E|}表示数据中隐含的包含或从属关系,attrs为节点属性集,children表示子节点集,三元组表示一个节点或一条折线段,即多维层次数据结构定义为D={<u,t>|u∈Um×n,t∈Tm};
对原始数据进行抽取、预处理生成预定义数据结构的数据:首先对原始数据集进行异常值处理,异常值包括空条目、数据类型错误,具体为,遍历每条记录,对其中存在的异常属性值按照不同的异常情况进行不同的处理,数值空条目进行零值填充,数据类型错误进行类型转换,根据该条目数据取平均或最值处理;再对预处理后的数据进行数据抽取,具体为,遍历数据集中的每条记录,记录由基本属性字段和特征字段组成,对于该记录生成与之对应的节点node,基本属性字段对应节点node中的atts属性集,而特征字段生成为:
每个uij对应该特征维度上的取值,同时根据数据中的组织结构或地理信息获取节点间的从属关系,得到由节点组成的节点集,即为隐藏的生成树模型,根节点即为无父节点的节点,表示为:获得可绘制的单个数据元素VisualItem;最后递归地对VisualItem进行绘制。
3.如权利要求1或2所述的基于径向布局的多维层次可视化方法,其特征在于,还包括借助Colorbrewer使用颜色放射渐变的方法,同时修改色调和透明度对每层节点进行着色,通过透明度加添加剂的设计方法使得满足筛选条件的节点或折线簇的辨识度提高。
4.如权利要求1或2所述的基于径向布局的多维层次可视化方法,其特征在于,还包括提供用户交互的接口,允许用户定制筛选规则,辅助用户从多角度多层次地探索和分析数据以发现潜在的知识和模式。
CN201510305090.XA 2015-06-05 2015-06-05 基于径向布局的多维层次可视化方法 Active CN104899288B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510305090.XA CN104899288B (zh) 2015-06-05 2015-06-05 基于径向布局的多维层次可视化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510305090.XA CN104899288B (zh) 2015-06-05 2015-06-05 基于径向布局的多维层次可视化方法

Publications (2)

Publication Number Publication Date
CN104899288A true CN104899288A (zh) 2015-09-09
CN104899288B CN104899288B (zh) 2018-01-26

Family

ID=54031950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510305090.XA Active CN104899288B (zh) 2015-06-05 2015-06-05 基于径向布局的多维层次可视化方法

Country Status (1)

Country Link
CN (1) CN104899288B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224656A (zh) * 2015-09-30 2016-01-06 北京工商大学 一种针对两类层次数据的对比关联可视分析方法和应用
CN106156369A (zh) * 2016-08-24 2016-11-23 北京京东尚科信息技术有限公司 多层级从属数据展示方法和装置
WO2017063145A1 (zh) * 2015-10-13 2017-04-20 华为技术有限公司 数据的可视化方法和装置
CN106960004A (zh) * 2017-02-15 2017-07-18 浙江大学 一种多维数据的分析方法
CN107170023A (zh) * 2017-07-11 2017-09-15 四川大学 一种面向多变元个体中心网络演变的可视化方法
CN110110002A (zh) * 2019-05-13 2019-08-09 江南大学 大数据可视化交互系统
CN110162568A (zh) * 2019-05-24 2019-08-23 东北大学 一种基于PCA-Radviz的三维数据可视化方法
CN111951985A (zh) * 2020-07-15 2020-11-17 四川大学 一种模块化空间核反应堆发电单元
US10936803B2 (en) 2018-04-02 2021-03-02 Microsoft Technology Licensing, Llc Aggregation and processing of hierarchical data for display of interactive user interface chart elements
CN112513582A (zh) * 2019-03-14 2021-03-16 日立产业控制解决方案有限公司 数据的三维可视化方法、数据的三维可视化程序以及数据的三维可视化系统
CN115061760A (zh) * 2022-05-30 2022-09-16 四川大学 一种面向分析过程的状态感知元可视化方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509350A (zh) * 2011-09-30 2012-06-20 北京航空航天大学 一种基于立方体的体育运动赛事信息可视化方法
WO2015054841A1 (zh) * 2013-10-16 2015-04-23 范煜 一种多维数据可视化查询方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509350A (zh) * 2011-09-30 2012-06-20 北京航空航天大学 一种基于立方体的体育运动赛事信息可视化方法
WO2015054841A1 (zh) * 2013-10-16 2015-04-23 范煜 一种多维数据可视化查询方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘芳: ""信息可视化技术及应用研究"", 《中国博士学位论文全文数据库 信息科技辑》 *
陈贞子: ""层次化数据可视分析方法及在PMS中的应用研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224656A (zh) * 2015-09-30 2016-01-06 北京工商大学 一种针对两类层次数据的对比关联可视分析方法和应用
CN105224656B (zh) * 2015-09-30 2018-06-15 北京工商大学 一种针对两类层次数据的对比关联可视分析方法和应用
US10438386B2 (en) 2015-10-13 2019-10-08 Huawei Technologies Co., Ltd. Data visualization method and apparatus
WO2017063145A1 (zh) * 2015-10-13 2017-04-20 华为技术有限公司 数据的可视化方法和装置
CN106156369A (zh) * 2016-08-24 2016-11-23 北京京东尚科信息技术有限公司 多层级从属数据展示方法和装置
CN106960004A (zh) * 2017-02-15 2017-07-18 浙江大学 一种多维数据的分析方法
CN107170023A (zh) * 2017-07-11 2017-09-15 四川大学 一种面向多变元个体中心网络演变的可视化方法
CN107170023B (zh) * 2017-07-11 2019-10-18 四川大学 一种面向多变元个体中心网络演变的可视化方法
US10936803B2 (en) 2018-04-02 2021-03-02 Microsoft Technology Licensing, Llc Aggregation and processing of hierarchical data for display of interactive user interface chart elements
CN112513582A (zh) * 2019-03-14 2021-03-16 日立产业控制解决方案有限公司 数据的三维可视化方法、数据的三维可视化程序以及数据的三维可视化系统
CN112513582B (zh) * 2019-03-14 2022-06-10 日立产业控制解决方案有限公司 数据的三维可视化方法、数据的三维可视化系统、记录介质
CN110110002A (zh) * 2019-05-13 2019-08-09 江南大学 大数据可视化交互系统
CN110110002B (zh) * 2019-05-13 2020-12-29 江南大学 大数据可视化交互系统
CN110162568A (zh) * 2019-05-24 2019-08-23 东北大学 一种基于PCA-Radviz的三维数据可视化方法
CN111951985A (zh) * 2020-07-15 2020-11-17 四川大学 一种模块化空间核反应堆发电单元
CN111951985B (zh) * 2020-07-15 2022-10-18 四川大学 一种模块化空间核反应堆发电单元
CN115061760A (zh) * 2022-05-30 2022-09-16 四川大学 一种面向分析过程的状态感知元可视化方法

Also Published As

Publication number Publication date
CN104899288B (zh) 2018-01-26

Similar Documents

Publication Publication Date Title
CN104899288A (zh) 基于径向布局的多维层次可视化方法
US11675801B2 (en) Data analysis platform utilizing database relationships to visualize data
Schulz et al. The design space of implicit hierarchy visualization: A survey
US9779150B1 (en) Systems and methods for filtering data used in data visualizations that use relationships
US9710527B1 (en) Systems and methods of arranging displayed elements in data visualizations and use relationships
CN108133044B (zh) 基于属性分离的空间大数据三维可视化方法及平台
Kehrer et al. Visualization and visual analysis of multifaceted scientific data: A survey
Zhou et al. Edge bundling in information visualization
Mennis et al. A conceptual framework for incorporating cognitive principles into geographical database representation
US10783173B2 (en) Methods and systems for selecting and analyzing geospatial data on a discrete global grid system
CN102629271B (zh) 一种基于堆叠树图的复杂数据可视化方法及设备
Batagelj et al. Visual analysis of large graphs using (x, y)-clustering and hybrid visualizations
Ma et al. Large-scale graph visualization and analytics
CN110019568A (zh) 基于空间聚类的选址方法、装置、计算机设备及存储介质
Tuttle et al. PedVis: a structured, space-efficient technique for pedigree visualization
Sun et al. A Web-based visual analytics system for real estate data
Gold Tessellations in GIS: Part I—putting it all together
Shi et al. HiMap: Adaptive visualization of large-scale online social networks
Görg et al. Visual representations
Sun et al. Brief talk about big data graph analysis and visualization
Schulz et al. Point-based visualization for large hierarchies
Burch Isoline-enhanced dynamic graph visualization
Jankun-Kelly et al. Scalability considerations for multivariate graph visualization
Liu et al. Graphics processing unit-based dynamic volume rendering for typhoons on a virtual globe
Chen et al. Constructing overview+ detail dendrogram-matrix views

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant