CN103049580B - 一种层次数据的可视化方法和设备 - Google Patents
一种层次数据的可视化方法和设备 Download PDFInfo
- Publication number
- CN103049580B CN103049580B CN201310017150.9A CN201310017150A CN103049580B CN 103049580 B CN103049580 B CN 103049580B CN 201310017150 A CN201310017150 A CN 201310017150A CN 103049580 B CN103049580 B CN 103049580B
- Authority
- CN
- China
- Prior art keywords
- node
- data
- radiation ring
- fan
- tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000005855 radiation Effects 0.000 claims abstract description 70
- 230000003044 adaptive effect Effects 0.000 claims abstract description 6
- 238000004458 analytical method Methods 0.000 claims abstract description 5
- 238000012360 testing method Methods 0.000 claims description 19
- 239000000575 pesticide Substances 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 15
- 238000012800 visualization Methods 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 11
- 239000003905 agrochemical Substances 0.000 claims description 6
- 238000013480 data collection Methods 0.000 claims description 6
- 238000002474 experimental method Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 230000002093 peripheral effect Effects 0.000 abstract description 3
- 230000000007 visual effect Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 239000000523 sample Substances 0.000 description 7
- 241000522946 Ormosia monosperma Species 0.000 description 6
- 235000010149 Brassica rapa subsp chinensis Nutrition 0.000 description 5
- 235000000536 Brassica rapa subsp pekinensis Nutrition 0.000 description 5
- 241000499436 Brassica rapa subsp. pekinensis Species 0.000 description 5
- TWFZGCMQGLPBSX-UHFFFAOYSA-N Carbendazim Natural products C1=CC=C2NC(NC(=O)OC)=NC2=C1 TWFZGCMQGLPBSX-UHFFFAOYSA-N 0.000 description 5
- 239000006013 carbendazim Substances 0.000 description 5
- JNPZQRQPIHJYNM-UHFFFAOYSA-N carbendazim Chemical compound C1=C[CH]C2=NC(NC(=O)OC)=NC2=C1 JNPZQRQPIHJYNM-UHFFFAOYSA-N 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 238000013517 stratification Methods 0.000 description 4
- 238000000547 structure data Methods 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 3
- 239000012141 concentrate Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000000474 nursing effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 235000011888 snacks Nutrition 0.000 description 2
- 238000007794 visualization technique Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000541656 Carex marina Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 235000015895 biscuits Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 235000013365 dairy product Nutrition 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- -1 eye-care " etc. Substances 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 235000015110 jellies Nutrition 0.000 description 1
- 239000008274 jelly Substances 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 235000013606 potato chips Nutrition 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公布了一种层次数据的可视化方法和设备。包括:对数据集HD按照其内部层次关系生成树型数据结构;将生成的树型数据结构中低于节点阈值的层级内每一个节点,用自适应的放射环算法生成扇形结构;将生成的树型数据结构中高于或等于节点阈值的层级内每一个节点,采用交互的方式,用项链环算法生成子放射环,即项链环;在显示平面上绘制并显示所述的放射环和项链环。本发明解决了以往可视化方法-放射环里中心区域空间利用率低、外围区域拥挤导致扇形面积太小,肉眼无法识别的问题,以此达到在有限的空间内最大程度地将数据的层次结构展现给用户,并通过交互,使得用户能够获得任意层次的细节信息以及层次之间的结构信息。
Description
技术领域
本发明属于信息可视化领域,具体涉及一种对大规模层次数据进行可视化的方法和设备。
背景技术
信息可视化旨在通过图形图像的方式,研究大规模非数值型信息资源的视觉呈现。层次信息可视化是信息可视化中重要的组成部分,在信息技术领域和社会经济的各个方面,大量的信息集合都具有严格的层次结构,例如:商品分类、企业员工的组织、磁盘文件结构等。随着Internet进一步发展,大量层次数据如何可视化已经成为可视化领域一个重要议题。在中国授权专利200710160532.1中,国际商业机器公司提出了一种层次化图结构数据可视化方法、装置,它在焦点区域呈现所述层次化图结构数据的细化到一个指定层级的多个节点及其之间的关系,以及在子图区域呈现所述层次化图结构数据的所述指定层级以下的节点及其关系。
层次数据可视化的主要方法包括节点链接式和空间填充式。具有层次结构的数据一般以节点的形式存储在树形结构中,节点链接式是指采用节点表示树形结构中的信息单元,用连线表示树形结构中的父子关系。空间填充式是指通过对矩形、正方形、扇形或是多边形等的填充来描述层次结构,常见的有两种:树图和放射环。树图采用矩形块来描述树形结构中的信息单元,用矩形嵌套的方式描述层次结构之间的父子关系。放射环采用扇形块来表达树形结构中的信息单元,采用扇形之间径向放射的关系表达树形结构中的父子关系,采用圆环之间的嵌套来表达层次与层次之间的关系。放射环一直被用来表述层次信息,2008年,XinghuaLou,ShixiaLiu和TianshuWang提出了一种动态的可视化方法:FanLens,通过动态展开收缩节点,方便用户探究层次关系和属性值的大小。2008年TatianaTekusova和obiasSchreck提出一种三维的放射环,即在二维的基础上增加高度维,为用户提供另一属性的查询。2012年Ho-ChingLam和IvoD.Dinov提出了一种基于放射环的HyperbolicWheel来展示层次数据,并根据扇形块面积大小确定标签字体的大小。
放射环虽然解决了树图无法展示层次关系的问题,但是却衍生出了新的问题:空间利用率低和边缘数据无法清晰查看。在放射环中,扇形块的面积大小是由圆心角和圆环半径共同决定的,当圆环宽度较大而该层节点数较少的时候,整个圆环所占面积基本是浪费的,扇形块的面积也是白白浪费的。另外,当数据量增大时,由于展示屏幕空间的限制,外圈圆环经扇形分割后已经模糊一片,无法供用户查看。
发明内容
本发明的一个目的是提供一种大量层次数据可视化的方法,将具有层次关系的数据用放射环的方式展示在二维平面中,放射环宽度和层数采用自适应的方式以增加空间利用率,再通过相关的交互技术,逐步展开底层节点,以项链环的形式绘制在中心放射环的周围,使得用户更加清晰直观地浏览数据全貌和探究数据细节。
本发明的另一个目的是提供一种采用上述方法对层次数据进行可视化的设备。
在叙述本发明的原理和步骤前,首先对本发明中待可视化的层次数据集HD做如下说明:
HD是一个具有层次结构的数据集,以多叉树的方式进行存储,假设该数据集有n个数据点,则多叉树上共有n个节点。用tij表示数据集中每一个数据点在多叉树上的节点表示,其中i表示节点所在树中的层数,j表示节点在该层所在的位置。比如t23表示第2层第3个节点。根据数据集本身的层次关系,将数据集按照层次关系表示出来:HD={C1,C2,…,Ci,…,Cn},0<i<=n,n表示数据集中层次数量,即分多少层,Ci表示第i层的分类集合,其中Ci={ti1,ti2,…,tik},t1k,t2k,tik均不相等。
对于一般的多叉树,节点一般采用顺序存储结构或者是链式存储结构,本发明采用链式存储结构,如图1。由多叉树的性质可以知道,节点一般由一个父节点(ParentNode)、一个数据元素(Data)和分别指向其第一个孩子(FirstChild)和下一个兄弟节点(NextSibling)的两个分支构成,即孩子-兄弟存储方式。树中节点共分为三种:根节点、非叶子节点和叶子节点,其中根节点的父节点为空,非叶子节点具备父节点和孩子、兄弟节点,而叶子节点具备父节点和兄弟节点,其孩子节点为空。对于HD中的每一个节点tij,都存储有以下信息:(1)vij:值信息,对应于该节点属性值;(2)lai:层信息,对应于该节点所在层数。
此外,本发明中所述扇形需由一个圆心cr、半径r、初始角度sta和扫过角度swa四个变量来决定。比如,对于第一层的根节点t11来讲,圆心cr,半径r1,初始角度sta=0,扫过角度为swa=360。若第二层共有4个节点,数据集中所有节点共用一个圆心cr,该层所有节点共用一个半径r2,则第一个节点扇形的起始角度swa=0,扫过角度swa=90。故t11所代表的扇形cs11就用(cr,r1,sta11,swa11)来表示。cr表示所有圆环共用的圆心坐标(x0,y0),r1表示第一层圆环所在圆的半径,sta11表示扇形的初始角度,swa11表示扇形的圆心角。
本发明提供的技术方案如下:
一种层次数据的可视化方法,其特征是,对于待显示的层次数据集HD,可视化处理包括如下步骤(流程如图2):
A.对数据集HD按照其内部层次关系生成树型数据结构;
B.将生成的树型数据结构中低于节点阈值的层级内每一个节点,用自适应的放射环算法生成扇形结构;
C.将生成的树型数据结构中高于或等于节点阈值的层级内每一个节点,采用交互的方式,用项链环算法生成子放射环,即项链环;
D.在显示平面上绘制并显示所述的放射环和项链环。
所述的层次数据的可视化方法,步骤A如下实现:
A1.根据数据集HD中的n个分类(例如全国地区的省市区县划分等),将每个分类的子集标注为C1,C2,…,Ci,…,Cn;
A2.读取每一个子集Ci,获取该子集中的所有节点ti1,ti2,…,tik,对应于树中第i层的所有节点;
A3.按照数据集HD中的层次关系,选取数据集中总分类所在的节点为整棵树的根节点,其中C1为第一层节点构成的子树,Cj为第j层节点构成的子树;
A4.计算树Cj中每个节点的属性值(例如全国某个地区某省某市某区县中某一种农作物中某一类农药的检测结果值),其中叶子节点的属性值即为该节点本身的值,非叶子节点的属性值等于其下层所有子节点的属性值之和,至此数据集HD按照相应的层次关系生成树形结构。
所述的层次数据的可视化方法,步骤B如下实现:
B1.设置显示平面上的直角坐标系,原点位于显示屏幕的左上角,有序实数对(x,y)表示点的位置坐标,(x0,y0)表示显示平面上选定的放射环圆心坐标;
B2.根据显示平面的大小,通过实验的方式(更改最外层的节点数在显示平面进行展示并进行观察),找出在该显示平面下,可视化图形的最外一层上可以清晰展示节点的最大个数,定义为阈值(这里的清晰是指用户通过肉眼可以辨别出任意一个可视化图形的轮廓);
B3.计算数据集中每一个分类子集Ci中节点总数,对于节点总数小于设定阈值的分类子集Ci中的每一个节点,在待显示平面上用一个扇形cs来表示,当圆心坐标(x0,y0)确定时,每一个扇形由半径r,起始角度sta和扇形圆心角swa单独确定所述的层次数据的可视化方法,步骤C如下实现:
C1.对数据集中高于或等于阈值的每一个数据子集,在待显示平面上同样用一个扇形cs来表示,每一个扇形由半径r,起始角度sta和扇形圆心角swa单独确定;
C2.用户通过鼠标双击或其它方式选择可视化图形中某一个扇形时,以该扇形所代表节点的子节点为根节点的子放射环圆心坐标均落在同一个圆周上,并同时出现在中心放射环的周围,如图3所示。
所述的层次数据的可视化方法,当用户鼠标点击中心放射环上的某一扇形子块时,使用标签显示详细信息;当用户鼠标点击任意一个项链环的任意位置时,该子放射环将会在显示平面的空白区域放大显示细节信息。
本发明同时提供一种层次数据的可视化设备,该设备由输入装置、数据采集模块、数据存储模块、数据处理模块和输出装置构成,其中,
输入装置,用于从外部输入数据,是数据集和用户或者其他装置通信或交互的桥梁;
数据采集模块,采用数据采集器将现场数据采集到数据库中,主要目的是获取数据以供数据存储模块和数据处理模块使用;
数据存储模块,用于对包含层次关系的数据进行存储以及数据筛选、过滤分类和统计等操作处理,所述数据被处理为树型数据结构进行存储;
数据处理模块,用于对层次数据集进行可视化处理,生成可视化图形;
输出装置,指显示终端,用于显示数据集的可视化结果;
所述可视化图形,对于生成的树型数据结构中低于节点阈值的层级内每一个节点,呈扇形结构构成的放射环状,对于生成的树型数据结构中高于或等于节点阈值的层级内每一个节点,采用交互的方式,用项链环算法生成子放射环,即项链环。
所述的层次数据的可视化设备,其特征是,所述输入装置,为键盘、鼠标或手写触屏板等。
所述的层次数据的可视化设备,其特征是,所述的输出装置,为计算机的显示器、PDA的显示屏或手机的显示屏等。
所述的层次数据的可视化设备,其特征是,用户通过双击显示屏中的可视化图形中某一扇形模块,展开该扇形所代表节点的下层结点;用户通过鼠标单击相应扇形模块来查看相关标签信息。
本发明同时提供一种应用,把所述的层次数据的可视化方法应用于农药残留数据检测分析展示,其特征是,把全国各个地区农药检测结果数据作为数据集HD;根据全国各大区域对数据集HD进行层次划分,数据的层次关系采用检测地点从大区域向小区域详细划分;设置阈值为100,按照所述的层次数据的可视化方法进行图形的生成和绘制,按照扇形块所代表的地区进行颜色分配,中心放射环采用颜色图例的方式标注,项链环本身采用标签标注,标签位置在中心放射环与子放射环的延长线上,项链环里面的每一个区县采用部分放大的方式标注,以达到区分农药在全国不同区域检测结果的目的。
本发明提供的大量层次数据可视化方法,解决了以往可视化方法-放射环里中心区域空间利用率低、外围区域拥挤导致扇形面积太小,肉眼无法识别的问题,以此达到在有限的空间内最大程度地将数据的层次结构展现给用户,并通过交互,使得用户能够获得任意层次的细节信息以及层次之间的结构信息。
附图说明
图1是本发明多叉树中孩子-兄弟存储方式的示意图。
图2是本发明所述方法的流程图。
图3是本发明所述项链环的示意图。
图4是本发明数据预处理流程图。
图5是本发明可视化图形绘制流程图。
图6是本发明自适应放射环算法的示意图。
图7是本发明项链环算法的示意图。
图8是本发明所述方法对具有层次关系的数据进行可视化的实例示意图。
图9是本发明提供交互方法的示意图。
图10是本发明提供的可视化设备示意图。
具体实施方式
本发明的第一个目的,提供一种大量层次数据的可视化方法,具体实施方式如下:
HD数据集{t11,t21,…,tij}是一个具有分类属性的集合,有且只有一个总类别。首先是对待可视化的数据集进行预处理,根据其本身层次结构,构造出每种分类的数据子集{C1,C2,…,Cm}。每一个分类类别Ci集合中包含若干个节点,Ci={ti1,ti2,…,tik}。
将HD中的每一个元素以多叉树的形式存储在树形结构中,则总类别对应于多叉树的根节点,每一分类级别对应于树形中每一层节点,用tij代表树形结构中每一个节点:
其中i表示该节点所在层数,j代表该节点在该层所处位置,m是指数据集的最大层数,n是指每一层中最大的节点数,tij可以为表示该处不存在该节点。例如,t23表示第二层第三个节点,若第二层共有三个节点,那么t24到t2n均为树形结构中每一层节点的集合对应集合C中的某一子集Ci,Ci一般不能为当Ci为时,代表数据集已经处理完毕。
其次,对树形结构中的每一层定义一个圆环半径ri,对于树形结构中每一个节点,定义以下变量vij、staij和swaij,其中R[ij]为半径的集合,m是数据集中的最大层数,Value[ij]是属性值集合,n为每一层的最大节点数,StartAngle[ij]和SweepAngle[ij]分别为初始角度和扫过角度(圆心角)的集合;
其中vij表示每一节点的属性值信息,例如含量、数量等;staij和swaij分别为显示平面上扇形的起始角度和扫过角度。数据集中每一数据元素在树形结构中对应一个节点,在可视化图形中对应一个扇形,而ri、staij和swaij三个变量唯一确定一个扇形结构csij,CircularSector[ij]为扇形结构的集合。
这时,每一个节点中含有一个扇形信息,以及唯一确定该扇形的圆环半径,初始角度和扫过角度的信息,从原始数据集HD得到最终完整的树形结构定义为NecklaceTree[ij],每一个添加好扇形信息的节点定义为ntij,则:
最后对处理后的NecklaceTree中的每一层lai节点总数设置一个阈值tsi,该阈值由显示屏幕所能承受的画面大小确定,在保证每一个可视化出的图形都能被用户所识别的情况下,圆环中可以承受的最多节点数目的临界值就是阈值。将前面处理好的NecklaceTree[ij]按照给定阈值大小分割为两个子集:NecklaceTree1[ij]和NecklaceTree2[ij]
当第i层中节点总数小于该阈值时,总是采用自适应的放射环算法进行数据处理,而当第j层中节点总数大于等于该阈值时,以该层所有节点为根节点,运用项链环算法进行数据处理,根据层次关系添加到父节点中,并通过可视化交互手段进行展开和收缩。
至此,得出本发明所需要的数据集预处理完毕,完整的数据预处理流程,如图4:
S101步,从外部加载数据集HD存储到数据库中,按照其内部的分类属性,将数据集HD划分出k个类别,{C1,C2,…,Ck}。
S102步,将数据库中所有元素以多叉树的存储方式存储在树形结构中,每一个元素对应多叉树中的一个节点tij。
S103步,使用显示平面中默认二维直角坐标系原点作为可视化图形的原点坐标(0,0),并获取屏幕上一点(x0,y0)作为放射环起点位置。
S104步,对数据集NecklaceTree中每一层的节点总数进行统计。
S105步,通过数据实验,设置单位圆环能清晰展示的最大节点数(即阈值)。若节点总数小于阈值,则将该层节点放入NecklaceTree的第一个子集NecklaceTree1中;
S106步,若第i层节点总数大于等于阈值,则将该层节点以及该层的子节点放入NecklaceTree的另一个子集NecklaceTree2中。
从原数据集的根节点出发,首先循环处理数据集NecklaceTree1,其次循环处理NecklaceTree2集合中的每一个元素,生成并绘制相应的扇形图集合CircularSection[ij],直至数据集中的数据处理完毕,跳至S115步,结束数据处理。
在S107至S110为处理NecklaceTree1时循环内的数据处理步骤。
S107步,判断数据集NecklaceTree1是否处理完毕。
S108步,读取输入节点的属性值vij,读入该层节点对应的圆环半径ri,待确定扇形的起始角度和扫过角度staij、swaij。
S109步,对每一个数据元素按照数据的层次关系进行层次化处理,直至对所有数据元素处理完毕,达到将数据的层次结构进行明确划分的目的。
S110步,将处理完毕的数据附加在节点之上,此时每一个节点包含一个与其层次结构和属性值相对应的扇形位置和面积,以供后续绘图使用。
在S111至S114为处理NecklaceTree2时循环内的数据处理步骤。
S111步,判断数据集NecklaceTree2是否处理完毕。
S112步,当第i层节点总数大于等于阈值时,判断鼠标点击的为第i-1层的节点为nt(i-1)j,则将该节点的每一个孩子节点作为输入的根节点。
S113步,读取每一个孩子节点的属性值vij,读入该层节点对应的圆环半径ri,待确定扇形的起始角度和扫过角度staij、swaij。
S114步,将处理完毕的每一个孩子节点的放射环附加在中心放射环周围,此时,项链环中每一个子放射环实际上是原始数据集中一个子集的可视化展示。
S115步,结束数据处理。
在对数据处理完毕后,下一步就是对数据的可视化图形的绘制。图形绘制的详细流程如图5所示。
S201步,读取由数据处理流程处理好的NecklaceTree1数据集中的数据。
S202步,在显示平面的直角坐标系中,(0,0)为屏幕左上角坐标,向右延伸为x轴,向下延伸为y轴。
S203步,判断数据集NecklaceTree1是否处理完毕。
S204步,执行循环绘制操作,从nt11开始逐一进行扇形的生成,根据每个扇形位置和面积信息绘制径向放射的环状可视化图形,父节点扇形与子节点扇形是放射包含关系,其中扇形块颜色代表该节点的属性名称,采用图例的方式展示,扇形块的位置代表该节点在树形结构上的位置,扇形块的面积代表该节点上属性值的大小,直至NecklaceTree1数据集中所有数据操作完毕,至此中心放射环绘制完毕,结束。
S206步,判断鼠标双击扇形块所代表的节点名称和位置。
S206步,循环NecklaceTree2数据集,从第一个孩子节点开始绘图,直到最后一个孩子节点。
S207步,绘制图形结束。
最终集合NeklaceTree中所有树形结构数据集ntij全部绘制完毕,达到本发明项链环的绘制目标。本发明的方法中使用放射的同心圆表示数据结构中的层次,使用径向的扇形块代表数据集中的各个元素,因此对层次结构的图形的绘制实质上是对一系列同心圆和扇形的定位与绘制。可视化图形的最终展示实际上包含两部分算法,自适应放射环算法和项链环算法。
自适应的放射环算法是定位和绘制中心放射环时所需要的算法。自适应放射环算法描述如下:
输入:初始根节点的相关信息,即初始扇形块的位置和面积;数据集合D,包含数据d1,d2,…,dn,该数据集中每一层的节点总数应低于阈值数。
输出:一系列代表数据d1,d2,…,dn的扇形块:f1,f2,…,fn。
1.读取初始扇形块信息,包括确定扇形位置所需要的圆心坐标cr、圆环半径r、扇形块的初始角度sta、扇形块的扫过角度(圆心角)swa(初始根节点有且只有一个,故初始sta=0,初始swa=360)
2.令待画扇形块为当前工作空间,深度方式遍历树形结构,若当前节点没有孩子节点(叶子节点),则转到步骤7,结束算法;否则转到步骤3,继续算法。
3.对树形结构中的每一个数据dn,获取dn的孩子节点,计算每个孩子节点在该父节点下所有孩子节点中的属性值比例:
其中表示父节点为dn的第j个孩子节点属性值与该父节点下所有孩子节点属性值总和的比率。表示父节点为dn的第j个孩子节点属性值。表示父节点为dn所有孩子节点属性值总和。
4.通过进行扇形块的计算,即每个孩子节点通过如下运算得到扇形块的起始角度sta和扫过角度swa:
其中表示父节点为dn的第j个孩子节点的初始角度。表示父节点为dn的第j-1个孩子节点的初始角度。表示父节点为dn的第j-1个孩子节点的扫过角度;表示父节点为dn的第j个孩子节点的扫过角度;表示父节点dn的扫过角度。
5.一个扇形块由圆心和半径来确定,故对数据集中第i层的节点,若该层节点总数小于设定阈值,则转向步骤6,继续算法;否则转向步骤7,结束算法。
6.放射环的圆心坐标为显示平面上一点cr(x0,y0),每一层的扇形共用一个圆环半径,该半径的大小取决于节点数与总层数的比例关系:
其中k1,k2为比例系数k1>1,k2>1,i为层数(如第一层i为1,第二层i为2),是当前树形结构的总深度(如该树形结构共有5层,则总深度为5),为第i层上的节点总数。
7.将扇形的位置和面积信息存储到节点中,算法结束。
在屏幕空间中绘制扇形块,图6为自适应放射环布局算法对一组目录数据进行布局的过程示意图。
项链环算法是定位和绘制周围放射环时所需要的算法。项链环算法描述如下:
输入:鼠标双击的节点信息;数据集合SD,包含数据sd1,sd2,…,sdn,该数据集就是鼠标双击节点的所有子节点数据。
输出:一系列代表数据sd1,sd2,…,sdn的扇形块:sf1,sf2,…,sfn。
1.将数据集合SD按照鼠标双击节点的下一层节点个数划分为m个数据子集SD[1],SD[2],…,SD[m]。
2.读取SD[m],确立与SD[m]相对应的每一个子放射环初始位置坐标(xm,ym),设扇形初始角度为0,因为共有m个小圆,那么两个小圆之间的圆心角为θ=360/m,将第一个子放射环的位置确定在水平θ=0的位置上,设R为项链环所共圆的大圆半径,即子放射环与初始圆心(x0,y0)之间的距离,则:
xm=x0+Rcosθ
ym=y0+Rsinθ
3.设里圈中心放射环最大半径为rs,外圈子放射环圆心与里圈放射环的距离,即两个圆心之间的距离为R,则外圈子放射环的最大半径rc不能超过R-rs。
rc<R-rs
4.循环每一个SD[m],重复自适应放射环算法中的第三步和第四步,直到所有SD[m]处理完毕,结束算法。
在屏幕空间中绘制扇形块,图7为项链环布局算法对父节点4.1.1的子节点的数据进行布局的过程示意图。
实施例1
下面以农药残留检测结果数据中的应用为例对本发明的可视化方法进行说明:
在农药残留检测的结果表中含有很多信息,比如:样品名称、样品分类、样品编号、采样时间、采样地点(包括采样的区域、省、市和区县)、样品来源、检测项目、检测方法、检测最低限、检测最高限以及检测结果(包括定量结果和定性结果)等。从结果表中可以看出,采样地点的分类问题是一个具有典型层次结构的数据集,直接放在表格中无法清晰完整的将层次结构和检测结果展示给用户,采用一般的点线分类方法,底层数据量大时也不足以完全清楚地展示。下面以本发明的方法来对该类数据进行可视化。假定用户希望查看某一时间段内,某一种农产品中某一种农药在不同区域内的检测结果。
假设现在有一个全国各个地区农药结果检测数据集HD,用户希望能够对HD中的数据进行可视化,以便查看出其中地区之间的层次关系和不同地域的农药残留检测结果,达到对农药含量超标的农产品进行控制和处理的目的。首先,假设用户希望能够得到2012年10月20日到2012年11月20日期间,华中地区河南省信阳市平桥区的大白菜中多菌灵的检测结果,如图8。本发明的方法按照用户的需求,读取农药残留检测结果表中的相关数据,主要包括:检测区域、检测省或直辖市、检测市、检测区县和检测结果数据,进行数据集HD的加载,根据全国各大区域对数据集进行层次划分,数据的层次关系采用检测地点从大区域向小区域详细划分(如检测地为华中地区河南省信阳市平桥区),每一层标注lai,其中i表示层次。将农药残留检测结果作为属性vij的值放入每一个数据中,这就构成了某一时间段内某一种农作物内某种农药检测结果的树形结构,得到数据集如下:
接下来,对上述的数据进行初始化,即自定义根节点初始变量,第一是圆心坐标和圆环半径,圆心坐标设为屏幕内合适的一点,即需要把整个可视化图形完整的放在待显示平面的适当位置,保证可视化图形未超出显示平面;初始圆环半径设为10,用一个小圆示意一下即可,避免浪费空间。第二是扇形的起始角度和扫过角度,由于根节点的唯一性,起始角度设为0,扫过角度设为360,即初始为一个圆。最后是扇形块的生成。
将根节点初始化后的数据集HD中的数据运用自适应放射环算法进行运算,会在阈值判断阶段将原始数据集分为两个子数据集HD1和HD2。在本数据集中,共有五层数据,分别为全国、地区、省直辖市、市和区县,每一层所含节点数分别为:全国1个、地区7个、省直辖市34个、市345个、区县3144。再根据实际计算机显示屏幕,为保证每一个可视化之后的扇形块都能为肉眼所看清,本发明的实例中将阈值取为100,也就是说节点总数小于100个的层放入数据子集HD1中继续采用自适应放射环算法生成中心放射环,节点总数大于等于100个的层(市和区县)放入数据子集HD2中采用项链环算法生成周围的子放射环。
最后进行图形的绘制,按照算法结果,深度优先遍历树形结构中每一个节点,将代表华中地区河南省信阳市平桥区的大白菜中多菌灵的检测结果的扇形块逐一绘制到屏幕中,并按照扇形块所代表的地区进行颜色分配,中心放射环采用颜色图例的方式标注,项链环本身采用标签标注,标签位置在中心放射环与子放射环的延长线上,项链环里面的每一个区县采用部分放大的方式标注,以达到区分农药在全国不同区域检测结果的目的。使用项链环的层次数据可视化方法,除了能够单独查看某一地区的农药检测结果,还可以比较不同地区同种农产品中同种农药残留的含量。比如可以通过扇形面积比较华中地区河南省信阳市平桥区和光山县之间大白菜中多菌灵的含量,可以通过项链环中每一个子放射环的面积比较华中地区河南省信阳市和华中地区河南省郑州市之间大白菜中多菌灵的含量。
本方法提供多种交互手段,包括鼠标双击和鼠标单击两种手段。本方法先将由自适应放射环算法生成的中心放射环展示给用户,以方便用户查看全局的整体信息。当用户想要对整体信息以外的细节信息进行研究时,需要鼠标双击该未知信息的根节点来展开该节点下的所有子节点信息。比如,用户想要查看华中地区河南省各个市以及各个区县里面大白菜中多菌灵的检测结果数据,那需要用户鼠标双击中心放射环代表河南省的扇形块,以展开河南省下面的所有市和区县。第二种交互手段鼠标单击为用户提供标签信息的查看。对于中心放射环中的每一个扇形块,当用户鼠标单击该扇形块面积区域时,则在鼠标附近位置显示出该扇形块所代表节点的详细信息,包括节点名称和农药检测含量值。对于外围项链环中的每一个子放射环,当用户鼠标点击该放射环的任意区域时,该放射环将被整体放大展示在屏幕的空白区域,每一个扇形块中将会标注出节点名称和农药检测含量值。图9为河南省信阳市的展开情况。当用户想要查看信阳市整体的情况时,可以鼠标单击信阳市这个子放射环区域的任意位置,从而在屏幕右边空白区域内放大该放射环,并直接在扇形块中标注出信阳市下面每一个区或县的名称和农药检测含量。
实施例2:
图10给出了按照本发明对所述层次数据进行可视化显示的设备的一个实施例。该设备由输入装置(鼠标,键盘,手写笔等,未标出)、数据采集模块(未标出)、数据存储模块(未标出)、数据处理模块(未标出)和输出装置(手机显示屏,计算机显示屏等)构成。
用户可以在该设备中具体操作可视化图形,可以通过外接鼠标单击或者双击屏幕相关区域以达到交互的目的。该设备首先由输入装置操作,数据采集模块负责读取待处理的层次数据集,并将数据以树形结构存储在数据存储模块中,这时通过输入装置操作,数据处理模块将读取存储的层次信息,通过自适应放射环算法生成中心放射环,以展示给用户全局信息。当用户再次通过输入装置操作,比如鼠标双击并判断双击区域,那么数据处理模块将读取另一部分存储的层次信息,通过项链环算法生成周围项链环的部分,以展示给用户细节信息,当用户双击另一扇形区域时,该扇形所代表节点的子节点数据将会重新绘图并出现在屏幕上,同时还可以借助鼠标等设备通过标签和放大的方式探究层次数据的细节信息。
实施例3
本发明的方法和设备也可用于网络购物中产品销量的可视化显示;
这些数据包括一段时间内不同分类的商品销量数据,该数据的根节点为“商品”,第二层节点为商品大类,可以包括“食品饮料、个人护理、厨房用品、数码通讯、服饰内衣、珠宝饰品”,第三层为商品的详细分类,食品饮料中可以包括“休闲零食、饼干糕点、牛奶乳品、方便速食”等等,个人护理可以包括“面部护肤、洗头护发、口腔护理、身体护理”等等,第四层为商品的具体分类,休闲零食中可以包括“薯片、果冻、海苔、鱼干”等等,面部护肤中可以包括“洁面、面膜、乳液、眼部护理”等等,第五层为商品的具体名称。可利用本发明展示上述层次结构数据,即在2012年11月份,每一种商品的销量情况,即使商品种类和名称很多,采用项链环也可以使用户清晰地查看相关销量数据。
Claims (5)
1.一种层次数据的可视化方法,其特征是,对于待显示的层次数据集HD,可视化处理包括如下步骤:
A.对数据集HD按照其内部层次关系生成树型数据结构;具体步骤如下:
A1.根据数据集HD中的n个分类,将每个分类的子集标注为C1,C2,…,Ci,…,Cn;
A2.读取每一个子集Ci,获取该子集中的所有节点ti1,ti2,…,tik,对应于树中第i层的所有节点,其中tik中的i表示节点所在树中的层数,k表示节点在该层所在的位置;
A3.按照数据集HD中的层次关系,选取数据集中总分类所在的节点为整棵树的根节点,其中C1为第一层节点构成的子树,Cj为第j层节点构成的子树;
A4.计算树Cj中每个节点的属性值,其中叶子节点的属性值即为该节点本身的值,非叶子节点的属性值等于其下层所有子节点的属性值之和,至此数据集HD按照相应的层次关系生成树型结构;
B.将生成的树型数据结构中低于节点阈值的层级内每一个节点,用自适应的放射环算法生成扇形结构;
C.将生成的树型数据结构中高于或等于节点阈值的层级内每一个节点,采用交互的方式,用项链环算法生成子放射环,即项链环;
D.在显示平面上绘制并显示所述的放射环和项链环。
2.如权利要求1所述的层次数据的可视化方法,其特征是,步骤B如下实现:
B1.设置显示平面上的直角坐标系,原点位于显示屏幕的左上角,有序实数对(x,y)表示点的位置坐标,(x0,y0)表示显示平面上选定的放射环圆心坐标;
B2.根据显示平面的大小,通过实验的方式,找出在该显示平面下,可视化图形的最外一层上可以清晰展示节点的最大个数,定义为阈值,所述清晰是指用户通过肉眼可以辨别出任意一个可视化图形的轮廓;
B3.计算数据集中每一个分类子集Ci中节点总数,对于节点总数小于设定阈值的分类子集Ci中的每一个节点,在待显示平面上用一个扇形cs来表示,当圆心坐标(x0,y0)确定时,每一个扇形由半径r,起始角度sta和扇形圆心角swa单独确定。
3.如权利要求2所述的层次数据的可视化方法,其特征是,步骤C如下实现:
C1.对数据集中高于或等于阈值的每一个数据子集,在待显示平面上同样用一个扇形cs来表示,每一个扇形由半径r,起始角度sta和扇形圆心角swa单独确定;
C2.用户通过鼠标双击或单击选择可视化图形中某一个扇形时,以该扇形所代表节点的子节点为根节点的子放射环圆心坐标均落在同一个圆周上,并同时出现在中心放射环的周围。
4.如权利要求3所述的层次数据的可视化方法,其特征是,当用户鼠标点击中心放射环上的某一扇形子块时,使用标签显示详细信息;当用户鼠标点击任意一个项链环的任意位置时,该子放射环将会在显示平面的空白区域放大显示细节信息。
5.权利要求1所述的层次数据的可视化方法于农药残留数据检测分析展示中的应用,其特征是,把全国各个地区农药检测结果数据作为数据集HD;根据全国各大区域对数据集HD进行层次划分,数据的层次关系采用检测地点从大区域向小区域详细划分;设置阈值为100,按照所述的层次数据的可视化方法进行图形的生成和绘制,按照扇形块所代表的地区进行颜色分配,中心放射环采用颜色图例的方式标注,项链环本身采用标签标注,标签位置在中心放射环与子放射环的延长线上,项链环里面的每一个区县采用部分放大的方式标注,以达到区分农药在全国不同区域检测结果的目的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310017150.9A CN103049580B (zh) | 2013-01-17 | 2013-01-17 | 一种层次数据的可视化方法和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310017150.9A CN103049580B (zh) | 2013-01-17 | 2013-01-17 | 一种层次数据的可视化方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103049580A CN103049580A (zh) | 2013-04-17 |
CN103049580B true CN103049580B (zh) | 2016-02-10 |
Family
ID=48062220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310017150.9A Expired - Fee Related CN103049580B (zh) | 2013-01-17 | 2013-01-17 | 一种层次数据的可视化方法和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103049580B (zh) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103793470B (zh) * | 2013-12-31 | 2017-10-24 | 远光软件股份有限公司 | 一种数据处理方法和装置 |
CN104008122A (zh) * | 2014-02-19 | 2014-08-27 | 浙江工商大学 | 层次化数据的动态多级饼图展示方法 |
CN104008125B (zh) * | 2014-02-26 | 2017-05-31 | 浙江工商大学 | 层次化数据的动态多级矩形图展示方法 |
US9891801B2 (en) * | 2014-05-12 | 2018-02-13 | Sap Se | Visualization and navigation for multi-dimensional hierarchical data |
CN104063493A (zh) * | 2014-07-04 | 2014-09-24 | 用友软件股份有限公司 | 级次布局的处理方法和级次布局的处理系统 |
CN104820677B (zh) * | 2015-04-14 | 2018-04-10 | 天脉聚源(北京)教育科技有限公司 | 一种学科层级展示方法及系统 |
CN105224656B (zh) * | 2015-09-30 | 2018-06-15 | 北京工商大学 | 一种针对两类层次数据的对比关联可视分析方法和应用 |
CN105404643B (zh) * | 2015-10-27 | 2018-06-12 | 北京工商大学 | 针对具有多维属性的层次结构数据的可视化方法和应用 |
CN105512218B (zh) * | 2015-11-30 | 2018-11-23 | 北京工商大学 | 一种关联层次数据的可视化方法和应用 |
CN105354335B (zh) * | 2015-12-08 | 2018-06-12 | 北京工商大学 | 针对时变层次数据的时变树图布局方法和应用 |
CN107016617B (zh) * | 2016-01-28 | 2020-06-26 | 北京工商大学 | 一种基于多重放射环的农产品农残检测数据的可视化方法 |
CN105573836B (zh) * | 2016-02-23 | 2018-12-28 | 中国农业银行股份有限公司 | 数据处理方法及装置 |
CN105809724B (zh) * | 2016-03-30 | 2018-05-11 | 湖南族谱网络科技有限公司 | 数据集显示方法、族谱数据显示方法和系统 |
CN106227828B (zh) * | 2016-07-25 | 2018-10-30 | 北京工商大学 | 一种同构层次数据对比可视分析方法和应用 |
CN106294298B (zh) * | 2016-07-27 | 2018-11-02 | 北京工商大学 | 基于多属性排序的数据可视分析方法和应用 |
CN107870231B (zh) * | 2016-09-26 | 2019-10-29 | 北京工商大学 | 一种针对农残检测数据的多属性对比可视化方法 |
CN106557323B (zh) * | 2016-11-09 | 2019-12-03 | 北京锐安科技有限公司 | 一种网络图可视化布局方法及装置 |
CN107180076B (zh) * | 2017-04-18 | 2018-08-24 | 中国检验检疫科学研究院 | 基于高分辨质谱+互联网+地理信息的农药残留可视方法 |
CN107067427B (zh) * | 2017-05-18 | 2020-03-31 | 北京工商大学 | 一种针对农残检测数据的极坐标布局可视化方法 |
CN107992590B (zh) * | 2017-12-11 | 2021-11-05 | 成都逸重力网络科技有限公司 | 一种有利于信息比对的大数据系统 |
CN108052587B (zh) * | 2017-12-11 | 2021-11-05 | 成都逸重力网络科技有限公司 | 基于决策树的大数据分析方法 |
CN110019225A (zh) * | 2017-12-21 | 2019-07-16 | 中国移动通信集团重庆有限公司 | 数据处理的方法、装置、设备及介质 |
CN108319667B (zh) * | 2018-01-22 | 2021-03-05 | 上海星合网络科技有限公司 | 多维的知识体系展示方法和装置 |
CN108804570A (zh) * | 2018-05-23 | 2018-11-13 | 成都直赢九州科技有限公司 | 一种树型层级结构的分布、存储与检索方法 |
CN109039705A (zh) * | 2018-06-29 | 2018-12-18 | 成都深思科技有限公司 | 一种网络互联互通数据图形展示方法、设备及存储介质 |
CN109408674B (zh) * | 2018-09-14 | 2020-04-07 | 深圳大学 | 基于仙人掌树的数据可视化方法、装置、设备及存储介质 |
CN110162577B (zh) * | 2019-05-09 | 2021-09-03 | 中国工商银行股份有限公司 | 企业族谱的可视化展现方法、设备以及系统 |
CN111625235B (zh) * | 2020-04-17 | 2021-09-24 | 北京大学 | 基于描述性语言的树可视化形式的构建、解构方法及系统 |
CN111597249A (zh) * | 2020-04-24 | 2020-08-28 | 深圳市商汤科技有限公司 | 数据显示方法和相关装置 |
CN113867850B (zh) * | 2020-06-29 | 2023-12-29 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置、设备和存储介质 |
CN113934478A (zh) * | 2020-07-13 | 2022-01-14 | 北京车行一六八信息技术有限公司 | 数据的可视化展示方法、装置、设备和存储介质 |
CN112632194B (zh) * | 2020-12-30 | 2023-11-03 | 平安证券股份有限公司 | 数据的图形可视化关系表示方法、装置、设备及存储介质 |
CN112818263B (zh) * | 2021-01-22 | 2023-08-18 | 西安交通大学 | 一种基于增强现实技术知识森林导航学习系统实现方法 |
CN113538058B (zh) * | 2021-07-23 | 2023-04-07 | 四川大学 | 一种面向网络购物平台的多层次用户画像可视化方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8015183B2 (en) * | 2006-06-12 | 2011-09-06 | Nokia Corporation | System and methods for providing statstically interesting geographical information based on queries to a geographic search engine |
CN101202661A (zh) * | 2007-11-30 | 2008-06-18 | 中国移动通信集团重庆有限公司 | 根据需求匹配业务数据与地图数据的方法 |
KR20110003947A (ko) * | 2009-07-07 | 2011-01-13 | 삼성전자주식회사 | 데이터 처리 장치 및 방법 |
US9021397B2 (en) * | 2011-03-15 | 2015-04-28 | Oracle International Corporation | Visualization and interaction with financial data using sunburst visualization |
-
2013
- 2013-01-17 CN CN201310017150.9A patent/CN103049580B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN103049580A (zh) | 2013-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103049580B (zh) | 一种层次数据的可视化方法和设备 | |
Greene et al. | Visual scenes are categorized by function. | |
Stell et al. | Stratified map spaces: A formal basis for multi-resolution spatial databases | |
Van Den Elzen et al. | Baobabview: Interactive construction and analysis of decision trees | |
US20150339835A1 (en) | Method and system for dynamically creating and exploring graph structures | |
CN105512218B (zh) | 一种关联层次数据的可视化方法和应用 | |
Du et al. | Representation and discovery of building patterns: A three-level relational approach | |
Adams et al. | Thematic signatures for cleansing and enriching place-related linked data | |
US20180004836A1 (en) | Scalable topological data analysis | |
Sun et al. | A five-level design framework for bicluster visualizations | |
García et al. | Visualization of information: a proposal to improve the search and access to digital resources in repositories | |
Leung et al. | FpMapViz: a space-filling visualization for frequent patterns | |
Vicentiy et al. | The development of dynamic cognitive interfaces for multisubject information systems (on the example of geosocial service) | |
Leung | Data science for big data applications and services: data lake management, data analytics and visualization | |
Scotch et al. | Development of SOVAT: A numerical–spatial decision support system for community health assessment research | |
Antunes et al. | Proof of concept of a novel cloud computing approach for object-based remote sensing data analysis and classification | |
Windhager et al. | Visualizing Uncertainty in Cultural Heritage Collections. | |
Huang et al. | A novel virtual node approach for interactive visual analytics of big datasets in parallel coordinates | |
Sarfraz et al. | Near real-time characterisation of urban environments: a holistic approach for monitoring dengue fever risk areas | |
Liiv et al. | Visual matrix explorer for collaborative seriation | |
Zhang et al. | VDM-RS: A visual data mining system for exploring and classifying remotely sensed images | |
Song | Evaluation on water resources and water ecological security with 2-tuple linguistic information | |
CN104102698A (zh) | 基于实体交叉与选择的数据视图切换和旋转方法和装置 | |
Ledesma et al. | Educational tool for generation and analysis of multidimensional modeling on data warehouse | |
Dodge | Information maps: tools for document exploration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Sun Yuehong Inventor after: Chen Yi Inventor after: Dong Yu Inventor after: Zhao Yunfang Inventor before: Chen Yi Inventor before: Gong Liwei Inventor before: Zhang Xinyue Inventor before: Sun Yuehong |
|
COR | Change of bibliographic data | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160210 |
|
CF01 | Termination of patent right due to non-payment of annual fee |