CN105354223B - 一种针对非连续层次数据的可视化方法和应用 - Google Patents
一种针对非连续层次数据的可视化方法和应用 Download PDFInfo
- Publication number
- CN105354223B CN105354223B CN201510640049.8A CN201510640049A CN105354223B CN 105354223 B CN105354223 B CN 105354223B CN 201510640049 A CN201510640049 A CN 201510640049A CN 105354223 B CN105354223 B CN 105354223B
- Authority
- CN
- China
- Prior art keywords
- data
- river
- period
- shoves
- discontinuous
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公布了一种非连续层次数据的可视化方法,针对具有时变特性的非连续层次数据,基于ThemeRiver模型和Treemap结点布局的方法,通过形成可利用用户交互方法来展示数据的层次特性和时序特征的主题河流图进行可视化;将可视化方法应用于农药残留数据的展示,对非连续层次数据集的数据点进行时间段划分,记录每个时间段中的数据点个数;设置数据点数目阈值对时间段内数据点个数小于所设置阈值补加数据节点,经过Themerive主题河流中心摇摆法计算得到数据值后进行图像拟合,生成主题河流图;采用颜色区分表示涌流;采用标签展示子涌流,通过用户交互方法动态展示,从而达到区分展示农药在不同区域检测结果的目的。
Description
技术领域
本发明属于信息可视化领域,具体涉及一种基于ThemeRiver模型的非连续层次数据的可视化方法和应用。
背景技术
随着社会的飞速发展,各种社会生活问题也随之暴露出来。大数据时代,现代化的手段如数据挖掘,机器学习等,将数据分析技术与先进的信息可视化技术相结合,可帮助人们掌握并分析领域内相关数据。
大规模层次数据可视化是现今的一大热点,通常情况下,此类数据同时还具有时间属性。如何在保持层次结构清晰展现的基础上,将时变特征表现出来是现今的一大挑战。展示层次数据的可视化方法主要有结点-链接法和空间填充法。其中,结点-链接法主要通过线段和结点连接的方式展现层次结构特性,优点是展现层次关系清晰明了,但是空间浪费严重。此外,当数量太大时,由于屏幕空间不足,十分容易出现结点重叠的现象。空间填充法的典型代表是Treemap方法,Treemap能够最大限度的利用空间,同时能够通过面积显示数据的属性值,但是在展现层次结构方面不如结点链接法直观。无论是结点链接法还是空间填充法,都很难在时间序列上合理的布局展示。
ThemeRiver模型是一种典型的处理时序数据的可视化的结构样式,它能够将得到的大量时序数据集合在一起,按时间顺序构造一个类似“河流”的可视化显示方式,通过河流的流动趋势和涌流(current)的坡度可以反映主题强度信息随时间的变化情况,这种方式能够解决大规模数据的时序特性,且无论主题如何变化,其走向总是清晰可见,一目了然。但主题河流能够展示的信息过于单一,通常无法展现数据的层次特性,难以展示具体细节信息。因此,针对具有时间属性的大规模层次数据,现有可视化方法难以实现同时表示数据的层次结构和时序特征。
发明内容
为了克服上述现有技术的不足,本发明提供一种基于ThemeRiver模型的非连续层次数据的可视化方法,基于ThemeRiver模型和Treemap结点布局的方法,通过形成可利用用户交互方法来展示数据的层次特性和时序特征的主题河流图对具有时变特性的大规模非连续层次数据进行可视化,实现同时表示数据的层次结构和时序特征。
本发明提供的技术方案是:
一种非连续层次数据的可视化方法,针对具有时变特性的非连续层次数据,基于ThemeRiver模型和Treemap结点布局的方法,通过形成可利用用户交互方法来展示数据的层次特性和时序特征的主题河流图进行可视化,包括如下步骤:
1)针对n个具有层次属性和时间特性的大规模数据集,进行预处理,执行如下操作:
11)对每个数据集按时间跨度进行划分处理,设总布局时间跨度为T;时间粒度为G;时间点为ti,i∈(0,z),其中z=T/G,为时间段的数目;
12)针对每个数据集,设定数据点个数门限值为K;针对每个时间段中的数据点的数目M,判断M是否大于等于K;若M小于K,则通过对不同年份的相同时间段的数据进行取平均操作得到新数据,为该时间段添加新的数据点,直到M=K;
13)针对每个数据集,得到z个时间段的数据,分别记为A1、A2、A3……Az;B1、B2、B3……Bz;……;
2)针对n个数据集,利用Themeriver主题河流的中心摇摆法,执行如下操作:
21)首先生成第一层次数据,作为河流的涌流数据线的纵坐标;包括如下步骤:
211)计算得到n个数据集z个时间段的数据值n1~nz,数据值n1~nz分别等于每个数据集在相应时间段数据的加和;
212)计算得到每一个时间段的初始点纵坐标,构成Themeriver主题河流的初始线,具体地:
计算第一个时间段的初始点纵坐标的公式为g0,1=g+n1;其中,g+g0,1=0;则
计算第二个时间段的初始点纵坐标为
以此类推;
对计算得到的所有时间段的初始点纵坐标数据进行图像拟合,得到Themeriver主题河流的初始线;
213)针对每一个数据集,计算得到该数据集在每一个时间段的纵坐标,构成Themeriver主题河流的一条涌流线;具体地,针对数据集A,利用步骤13)中得到的z个时间段的数据A1、A2、A3……Az;z个时间段的纵坐标值分别为g1,1=g0,1+A1;g1,2=g0,2+A2;以此类推;
对计算得到的所有时间段的纵坐标值数据进行图像拟合,得到该数据集相对应的一条涌流线的数据;
针对所有数据集,按照上述步骤计算得到所有数据集在每一个时间段的纵坐标,构成Themeriver主题河流的n条涌流线;
22)针对上述非连续层次数据集的第一层次数据之下层的第二层次数据,通过与步骤21)相同的方法对数据进行处理和计算,得到所有层次数据集的第一层次数据所属的第二层次数据的数据线,构成第一层次数据相应的涌流下属的子涌流线;
23)逐层数据进行步骤21)相同的处理,直至得到所有层次的数据线;
3)绘制主题河流图,包括:
31)将得到的初始线和n条涌流线绘制到屏幕上,构成第一层次的主题河流图;
绘制出的主题河流图中,初始线到第一条涌流线之间的区域代表该涌流线相对应的数据集;第一条涌流线到第二条涌流线之间的区域代表第二条涌流线相对应的数据集;以此类推;每个区域用不同颜色区分;
32)在第一层次的主题河流图上,在每一个数据集相对应的区域,采用与步骤31)相同方法,绘制该数据集对应的下一层次数据的初始线和子涌流线;构成具有多层次的主题河流图。
针对上述针对非连续层次数据的可视化方法,进一步地,步骤3)所述绘制主题河流图,采用颜色差异较大的不同色系显示不同涌流;涌流内部的子涌流采用相同色系不同饱和度的颜色进行展示。
针对上述针对非连续层次数据的可视化方法,进一步地,步骤32)所述子涌流通过标签进行展示,展示子涌流的标签布局按照以下方法进行:
E1.1标签显示不能够遮挡其他涌流;
E1.2能够明确表示显示的标签与该标签展示子涌流所属的涌流的关系,具体地,在涌流较小的情况下,标签可以直接分布在每个涌流层上面;当涌流过多时,通过交互操作,通过鼠标滑动和点击主题河流中的某一条涌流来弹出窗口显示标签信息。
针对上述针对非连续层次数据的可视化方法,进一步地,通过交互操作方式绘制主题河流图,用户点击选取主题河流图中的某个涌流,未点选的涌流颜色淡去,放大选取的涌流进一步显示该涌流内部的子涌流。
针对上述针对非连续层次数据的可视化方法,进一步地,步骤进行图像拟合包括高斯模型图像拟合和傅里叶模型图像拟合。
本发明同时提供一种应用,将上述针对非连续层次数据的可视化方法应用于农药残留数据的展示,其特征是,把某区域内的多个地区各个省份的农药检测结果数据作为非连续层次数据集,第一层次为地区,第二层次为地区包括的省份;根据时间跨度对非连续层次数据集的数据点进行时间段划分,记录每个时间段中的数据点的个数;通过设置数据点数目阈值对时间段内数据点个数小于所设置阈值补加数据节点,将上述数据逐一按层次经过Themerive主题河流中心摇摆法计算得到数据值后进行图像拟合,根据ThemeRiver模型和Treemap结点布局方法,生成主题河流图;将主题河流图绘制在显示屏上,采用颜色区分表示主题河流的涌流;采用标签展示子涌流,并通过用户交互方法动态展示,从而达到区分展示农药在不同区域检测结果的目的。
与现有技术相比,本发明的有益效果是:
现有可视化方法在解决层次数据的时候,往往无法兼顾其时间属性;而单独对时间进行可视化的方法,往往无法直观的展示层次结构特性的问题。本发明提供一种层次河流的可视化方案,将树图中空间填充表达层次的思想与ThemeRiver模型相结合,同时能够反映数据的层次关系与随时间变化的趋势。本发明提供一种基于ThemeRiver模型的非连续层次数据的可视化方法及其系统,基于ThemeRiver模型和Treemap结点布局的方法,通过形成可利用用户交互方法来展示数据的层次特性和时序特征的主题河流图对具有时变特性的大规模非连续层次数据进行可视化,在兼顾ThemeRiver模型中对于层次层次关系与随时间变化的趋势的同时,利用树图treemap的空间层次来加入空间地理的数据的显示方法,表示数据的层次结构和时序特征,形成用户可交互的可视化方法,实现同时表示数据的层次结构和时序特征。
附图说明
图1为本发明提供的针对非连续层次数据的可视化方法的流程框图。
图2为本发明实施例中数据处理阶段的数据结点集s的形成过程示意图;
其中,ti-1、ti和ti+1表示三个连续的时间段;M为每一时间段内的数据节点的数目;p1为数据处理中M不足设定门限值时的补加节点;p2为临界公用节点。
图3为本发明实施例中针对2013年白菜中的农药超标情况进行图像拟合绘制的图形图像;
其中,(a)为折线图;(b)为采用高斯模型拟合的图像;(c)为采用傅里叶模型拟合的图像。
图4为本发明实施例通过主题河流布局方法对2013年某大区各省白菜农药超标情况生成的布局结果示意图;
其中,横坐标为时间(年月),纵坐标为检出频次。
图5为本发明实施例中标签显示采用用户交互方式显示子主题信息的截图。
图6为本发明实施例中某一省份2011年到2014年1~12月份的白菜农药超标检出次数数据(单位为次)的雷达图;
图7为本发明实施例中利用2013年10月A地区和B地区白菜农药超标数据生成的主题河流图;
其中,A1~A5代表A地区不同省份;B1~B4代表B地区不同省份,共9个省份。
具体实施方式
下面结合附图,通过实施例进一步描述本发明,但不以任何方式限制本发明的范围。
本发明提供一种层次河流的可视化方案,是一种具有时变特性的大规模层次数据可视化方案,通过将传统的ThemeRiver可视化模型进行改进,结合Treemap结点布局的方法,形成一个具有用户交互功能且能够显示层次特性的河流图。该方法首先对数据点划分时间段分别进行统计,补充新的数据点,构造数据点集,再利用高斯模型曲线拟合,最后经过主题布局排序,颜色选择,标签分布布局,形成一种具有预测功能且能够展示层次特征的新型主题河流模型,实现对具有时变特性的大规模层次数据进行可视化展示。
本发明提供的ThemeRiver主题河流可视化模型中,主题河流(河流)包括多个涌流,涌流可再细分为子涌流。具体说来,涌流代表相同颜色充满整个时间段的图形,一条涌流可分为若干子涌流,子涌流一般用于数据下钻(比如,若涌流代表地区数据,则子涌流代表地区下蕴含的各个省市的数据)。所有涌流的整体组成河流。在河流布局中,为避免布局遮挡或杂乱,可采用标签来标示涌流或子涌流(所代表的数据)。
图1为本发明提供的针对非连续层次数据的可视化方法的流程框图,本发明实施例中针对某区域2011~2014年大白菜中的农药检出频次数据情况进行可视化,具体实施包括如下操作:
待处理的数据集为具有层次属性和时间特性的大规模数据集,对数据的预处理包括如下步骤:
11)对数据集按时间跨度进行划分处理,设总布局时间跨度为T;时间粒度为G;时间点为ti,i∈(0,n),其中n=T/G。
12)设定数据点个数门限值为K;针对每个时间段中的数据,判断M是否大于等于K;若M小于K,则通过对不同年份的相同时间段的数据进行取平均操作得到新数据,为该时间段添加新的数据点,直到M=K;
图2为本发明实施例中数据处理阶段的数据结点集s的形成过程示意图;其中,ti-1、ti和ti+1表示三个连续的时间段;M为每一时间段内的数据节点的数目;p1为数据处理中M不足设定门限值时的补加节点;p2为临界公用节点。设置门限个数为k(k由用户指定);以第i个时间点为例,如图2所示,若第i个时间结点周围数据点个数M大于等于门限个数k(以k=3为例),则所有数据结点保留,形成结点集S;若第i个时间结点周围数据点个数M不足k个(其中,临界公用节点是指临界数据点公用,即临界时间点上的数据点,既属于上一时间段的数据集,又属于下一时间段的数据集),则通过对最近不同年份相同时间内的数据点的取平均操作进行数据点的添加,使其结点个数等于门限值k,最后形成数据节点集S。
添加数据点的具体方法为:以图中ti-1段为例,设三年同时段的数据按照出现时间点频率进行排序,出现时间点频率最高的数据集为D,对D内的数据进行平均操作,并将结果添加到当前年份的时间段内对应的时间点,如图中点p1所示。若仍不足k,则选择低于最高频率的时间点数据集进行相同的操作进行添加,直到添加该区域内数据点数目达到k。
本实施例,针对数据的处理包括:从农残数据库中抽取2011-2014年两大地区(A、B)九个省份对白菜的农药检出频次数据(分别记为A1-A5和B1-B4)进行处理;由于数据库中存储的农药检出频次数据是按照单月份存储,即数据处理步骤中数据按照每一个月份进行时间划分,相当于数据已在时间上进行聚类,时间点为1~12月每个月。
本发明提供方法处理的数据节点集为两个(包括两个地区),每一个数据节点集S可包括一个或多个层次(本实施例地区A包括五个省份,地区B包括四个省份);针对每一个数据节点集S,利用Themeriver中心摇摆法,执行如下操作:
21)首先生成第一层次数据,第一层次数据即河流涌流数据线的纵坐标,本实施例中,包括计算初始线和各个地区线;从数据库中随机抽取数据,对于1~12月的检出频次数据,各个地区有不同的检出频次。记A地区12个月的数据分别为A1、A2、A3……A12,若还有其它地区分别记为B、C、D……,地区个数记为n(本实施例n=2),它们1~12月份检出频次数据分别记为脚标1~12。n1=A1+B1+C1...(共n个),同理计算其余n2~n12的数值。
计算初始线:计算一月份初始点纵坐标的公式为g0,1=g+n1(0代表初始线,1代表第一个月),其中规定g+g0,1=0,即可计算出此时g0,1为一月份的初始点。计算二月份初始点纵坐标为同理可计算其余十个月份的值。对计算得到的十二个月数据通过matlab中的二阶高斯拟合和三阶傅里叶模型进行图像拟合。通过模拟数据可知,高斯模型更加适合。至此,得到初始线的数据。
计算地区线:针对地区A,第一条线的12个月的数据:g1,1=g0,1+A1,g1,2=g0,2+A2……g1,12=g0,12+A12。对计算得到的十二个月数据通过matlab中的二阶高斯模型进行图像拟合。至此,得到A地区线的数据。
同理将所有地区的数据按照排列好的顺序遍历一遍,得到n+1条数据线,构成河流涌流数据线,包括1条初始线和n条地区线;
将得到的n+1条数据线绘制到屏幕上,即得到表现该区域大白菜中的农药检出频次数据情况的主题河流图。绘制出的主题河流图中,初始线在下方;针对n条地区数据线,按照由下向上的方向,第一个月检出频次数据(即A1、B1、……)从小到大的顺序进行排列绘制布局:即按由下向上的方向,检出频次较小的先绘制,检出频次较大的后绘制;
绘制出的主题河流图中,初始线到第一条数据线之间的区域为第一条数据线所代表的地区,第一条数据线到第二条数据线之间的区域记为第二条数据线所代表的地区,每个地区数据所在的区域构成主题河流的一条涌流。
22)针对上述非连续层次数据集的第一层次数据之下层的第二层次数据,本发明实施例中第二层次数据为每个地区所包括的省份数据,通过与步骤21)相同的方法对数据进行处理和绘制,得到所有地区所属的省份的数据线,每个省份数据所在的区域构成该地区涌流下属的一条子涌流;
23)逐层数据进行步骤21)相同的处理,直至处理并绘制所有层次数据。
上述针对非连续层次数据的可视化方法中,每条涌流代表地区的子涌流相对应的检出频次数据(代表该地区下属的省份数据),可用标签进行展示。
上述方法中,针对处理形成的数据点集S,通过matlab中的二阶高斯拟合和三阶傅里叶模型进行图像拟合,可得到与数据更加匹配的函数,用于生成河流图;具体地,
21A)二阶高斯拟合模型为式1:
(式1)
式1中,x为待处理的数据点集中的数据点;f(x)为二阶高斯模型图像拟合函数;参数a1,a2代表曲线开闭大小;b1,b2,c1,c2共同决定拟合图像的振幅大小。本实施例中,针对某一省份某一地区2011~2014大白菜的农药检出频次数据,经过matlab计算所得结果为:a1=104,b1=14.07,c1=6.82,a2=33.18,b2=34.2,c2=7.98;确定参数a、b、c的值可得出最符合这一地区2011~2014大白菜的农药检出频次数据的曲线。
21B)三阶傅里叶拟合模型为式2:
f(x)=a0+a1 cos(wx)+b1 sin(wx)+
a2 cos(2wx)+b2 sin(2wx)+
a3 cos(3wx)+b3 sin(3wx) (式2)
式2中,x为待处理的数据点集中的数据点;f(x)为三阶傅里叶拟合模型图像拟合函数;a类参数是sinx函数的系数;b类参数是cosx函数的系数,w代表函数周期性大小。本实施例中,针对某一省份某一地区2011~2014大白菜的农药检出频次数据,经过matlab计算所得结果为:a0=27.58,a1=-6.77,b1=-18.54,a2=-23.18,b2=-18.48,a3=0.164,b3=16.47,w=0.879。确定a、b参数值可得出最符合这一地区2011~2014大白菜的农药检出频次数据的曲线的振幅大小。
针对本实施例数据,根据分析实验结果表明,高斯模型进行图像拟合得到的公式为优选方案。图3为本发明实施例中针对某一省份某一地区2011~2014年大白菜中的农药检出频次数据情况进行图像拟合绘制的图形图像;其中,(a)为折线图;(b)为采用高斯模型拟合的图像;(c)为采用傅里叶模型拟合的图像。
将经过图像拟合获得的数据通过上述布局方法进行构图绘制,具体采用ThemeRiver方法与Treemap中的Slice and Dice方法生成ThemeRiver主题河流,进行可视化构图。
本实施例采用c#编程实现生成河流图的ThemeRiver方法,主题排序布局过程可以下列伪代码描述,其中n为主题河流中所有涌流(current)的个数:
采用上述布局方法的好处是:其一,不用重新进行拆分布局,减少交叉;其二,能够保证中间位置的涌流是较旧涌流,两边的涌流是较新涌流;同时,位于整体布局上方涌流的宽度逐渐下降,位于整体布局下方涌流的宽度是逐渐上升;有助于用户快速的找到自己感兴趣的主题并且对于主题的先后顺序有一个宏观的展示。图4为本发明实施例通过主题河流布局方法对2011~2014年某地区各省大白菜农药检出频次生成的可视化结果示意图。
可视化时,用颜色来表示主题河流;在主题河流颜色选用方面:对于每个涌流的颜色分配,本发明按照传统ThemeRiver的配色方法,采用了相似涌流采用相同色系的不同颜色来进行绘制,且不同涌流间要颜色区分鲜明;即用颜色差异较大的不同色系显示不同涌流;而内部的子涌流结构用相同色系不同饱和度的颜色进行布局;颜色越深表示主题存在时间越长,由布局顺序限制,通常情况下,两侧的涌流由于存在时间较短,因此颜色浓度逐渐变浅。如图3所示,布局结果为某大区各个省的2013年1月~10月大白菜农药检出频次结果可视化结果。
进行可视化时,可采用标签形式展示所点击涌流包含的子涌流,展示子涌流的标签的布局按照以下方法进行:
E1.1标签显示不能够遮挡其他涌流;
E1.2能够明确表示显示的标签与该标签展示子涌流所属的涌流的关系,具体地,在涌流较小的情况下,标签可以直接分布在每个涌流层上面;当涌流过多时,标签就没有地方能够布局显示。此时,可通过交互操作,通过鼠标滑动和点击主题河流中的某一条涌流来弹出窗口显示标签信息。
当主题(涌流)过多时,每个子主题(子涌流)的展示会受到显示区域的影响,容易造成视觉布局混乱。可采用交互可视化的方法,有效减小视觉杂乱的影响,例如,可用纯色代表每个主题,通过点击某个主题,其他主题颜色淡去,放大该主题显示其内部子主题。图5为本发明实施例中标签显示采用用户交互方式显示子主题信息的截图。
食品安全领域的农产品中农药残留量检测结果数据(简称农残数据)属于此类具有时间属性的大规模层次数据。农残数据具有典型的层次属性和时间特性。本实施例对农残数据进行可视化,通过对农残数据样例进行分析发现,农残数据是典型的层次数据,并且具有明显的时间属性,包括地域划分、产品种类和农药种类等层次属性,对于农残数据的分析和可视化需要关注残留量的数值的数值变化,因此需要关注采样时间。
本实施例在利用本发明提供的ThemeRiver可视化方法进行可视化之前,针对2011-2014年两大地区(A、B)九个省份对白菜的农药检出频次数据(分别记为A1-A5和B1-B4),首先通过绘制雷达图,选择需要进行可视化的年份。绘制雷达图具体包括如下步骤:
利用从数据库中提取出的数据进行初步的去噪音处理后形成的较整齐数据,生成雷达图;采用雷达图的表现方式有助于对周期模式的挖掘,通过对每一年的每个月的内的数值进行分类,找出能够代表本月份的数值,在雷达图上进行显示;具体地,对初步整理好(简单去除杂音)的数据输入microsoft excel中,利用excel中绘制雷达图的功能对数据进行绘图,如图6所示,以2011-2014年的实际数据为例,将数据处理分别制作雷达图,图6为本发明实施例中2011-2014年某一地区某一省份白菜农药超标数据的雷达图。如图6所示,用不同的颜色表示不同的年份,(附图中为灰度),能够清晰的看出,白菜超标频次较高的月份为八月份和十月份,而一月份超标例数较低;分析出现这种现象,其原因有很多:有可能当月检测力度不够。也可能白菜上的农药经过一冬天的降解,农药浓度减小,使得超标的频次降低;
图7为本发明实施例中利用2013年10月A地区和B地区白菜农药超标数据生成的主题河流图;其中,A1~A4代表A地区不同省份;B1~B4代表B地区不同省份。即图7展示的是2013年10月份的A、B两大省中A1-A5、B1-B4九个省份的白菜超标数据,用户可通过点击每个涌流能够显示详细的数据信息。
本实施例使用的农残数据为农药超标检出频次数据,分别利用雷达图和本发明提供的ThemeRiver可视化改进方法,同时加上交互方法对农药在同一个省市不同地区的超标情况进行展示。基于该展示结果,能够较为容易的对农药超标情况进行监测,并通过简易直观的分析,得出相应的结论。
需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。
Claims (6)
1.一种针对非连续层次数据的可视化方法,针对具有时变特性的非连续层次数据,基于ThemeRiver模型和Treemap结点布局的方法,通过形成可利用用户交互方法来展示数据的层次特性和时序特征的主题河流图进行可视化,包括如下步骤:
1)针对n个具有层次属性和时间特性的大规模数据集,进行预处理,执行如下操作:
11)对每个数据集按时间跨度进行划分处理,设总布局时间跨度为T;时间粒度为G;时间点为ti,i∈(0,z),其中z=T/G,z为时间段的数目;
12)针对每个数据集,设定数据点个数门限值为K;针对每个时间段中的数据点的数目M,判断M是否大于等于K;若M小于K,则通过对不同年份的相同时间段的数据进行取平均操作得到新数据,为该时间段添加新的数据点,直到M=K;
13)针对每个数据集,得到z个时间段的数据,分别记为A1、A2、A3……Az;B1、B2、B3……Bz;……;
2)针对n个数据集,利用Themeriver主题河流的中心摇摆法,执行如下操作:
21)首先生成第一层次数据,作为河流的涌流数据线的纵坐标;包括如下步骤:
211)计算得到n个数据集z个时间段的数据值n1~nz,数据值n1~nz分别等于每个数据集在相应时间段数据的加和;
212)计算得到每一个时间段的初始点纵坐标,构成Themeriver主题河流的初始线,具体地:
计算第一个时间段的初始点纵坐标的公式为g0,1=g+n1;其中,g+g0,1=0;则
计算第二个时间段的初始点纵坐标为
以此类推;
对计算得到的所有时间段的初始点纵坐标数据进行图像拟合,得到Themeriver主题河流的初始线;
213)针对每一个数据集,计算得到该数据集在每一个时间段的纵坐标,构成Themeriver主题河流的一条涌流线;具体地,针对数据集A,利用步骤13)中得到的z个时间段的数据A1、A2、A3……Az;z个时间段的纵坐标值分别为g1,1=g0,1+A1;g1,2=g0,2+A2;以此类推;
对计算得到的所有时间段的纵坐标值数据进行图像拟合,得到该数据集相对应的一条涌流线的数据;
针对所有数据集,按照上述步骤计算得到所有数据集在每一个时间段的纵坐标,构成Themeriver主题河流的n条涌流线;
22)针对上述非连续层次数据集的第一层次数据之下层的第二层次数据,通过与步骤21)相同的方法对数据进行处理和计算,得到所有层次数据集的第一层次数据所属的第二层次数据的数据线,构成第一层次数据相应的涌流下属的子涌流线;
23)逐层数据进行步骤21)相同的处理,直至得到所有层次的数据线;
3)绘制主题河流图,包括:
31)将得到的初始线和n条涌流线绘制到屏幕上,构成第一层次的主题河流图;
绘制出的主题河流图中,初始线到第一条涌流线之间的区域代表该涌流线相对应的数据集;第一条涌流线到第二条涌流线之间的区域代表第二条涌流线相对应的数据集;以此类推;每个区域用不同颜色区分;
32)在第一层次的主题河流图上,在每一个数据集相对应的区域,采用与步骤31)相同方法,绘制该数据集对应的下一层次数据的初始线和子涌流线;构成具有多层次的主题河流图。
2.如权利要求1所述针对非连续层次数据的可视化方法,其特征是,步骤3)所述绘制主题河流图,采用颜色差异较大的不同色系显示不同涌流;涌流内部的子涌流采用相同色系不同饱和度的颜色进行展示。
3.如权利要求1所述针对非连续层次数据的可视化方法,其特征是,步骤32)所述子涌流通过标签进行展示,展示子涌流的标签布局按照以下方法进行:
E1.1标签显示不能够遮挡其他涌流;
E1.2能够明确表示显示的标签与该标签展示子涌流所属的涌流的关系,具体地,在涌流较小的情况下,标签可以直接分布在每个涌流层上面;当涌流过多时,通过交互操作,通过鼠标滑动和点击主题河流中的某一条涌流来弹出窗口显示标签信息。
4.如权利要求1所述针对非连续层次数据的可视化方法,其特征是,通过交互操作方式绘制主题河流图,用户点击选取主题河流图中的某个涌流,未点选的涌流颜色淡去,放大选取的涌流进一步显示该涌流内部的子涌流。
5.如权利要求1所述针对非连续层次数据的可视化方法,其特征是,步骤212)和213)中进行图像拟合包括高斯模型图像拟合和傅里叶模型图像拟合。
6.将权利要求1所述针对非连续层次数据的可视化方法应用于农药残留数据的展示,其特征是,把某区域内的多个地区各个省份的农药检测结果数据作为非连续层次数据集,第一层次为地区,第二层次为地区包括的省份;根据时间跨度对非连续层次数据集的数据点进行时间段划分,记录每个时间段中的数据点的个数;通过设置数据点数目阈值对时间段内数据点个数小于所设置阈值补加数据节点,将上述数据逐一按层次经过Themeriver主题河流中心摇摆法计算得到数据值后进行图像拟合,根据ThemeRiver模型和Treemap结点布局方法,生成主题河流图;将主题河流图绘制在显示屏上,采用颜色区分表示主题河流的涌流;采用标签展示子涌流,并通过用户交互方法动态展示,从而达到区分展示农药在不同区域检测结果的目的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510640049.8A CN105354223B (zh) | 2015-10-05 | 2015-10-05 | 一种针对非连续层次数据的可视化方法和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510640049.8A CN105354223B (zh) | 2015-10-05 | 2015-10-05 | 一种针对非连续层次数据的可视化方法和应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105354223A CN105354223A (zh) | 2016-02-24 |
CN105354223B true CN105354223B (zh) | 2018-05-04 |
Family
ID=55330196
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510640049.8A Active CN105354223B (zh) | 2015-10-05 | 2015-10-05 | 一种针对非连续层次数据的可视化方法和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105354223B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106354760B (zh) * | 2016-08-18 | 2018-12-11 | 北京工商大学 | 基于变形统计地图的多视图时空数据可视化方法与应用 |
CN106909381B (zh) * | 2017-02-24 | 2020-01-03 | 西南交通大学 | 一种交互式的主题河流可视化方法 |
JP6829117B2 (ja) * | 2017-03-15 | 2021-02-10 | 株式会社Screenホールディングス | テキストマイニング支援方法および装置 |
CN107958020A (zh) * | 2017-10-24 | 2018-04-24 | 中国南方电网有限责任公司超高压输电公司检修试验中心 | 一种基于聚簇的电网数据处理和数据可视化方法 |
CN108898157B (zh) * | 2018-05-28 | 2021-12-24 | 浙江理工大学 | 基于卷积神经网络的数值型数据的雷达图表示的分类方法 |
CN109190148B (zh) * | 2018-07-17 | 2020-07-03 | 西南交通大学 | 一种主题河流重排序方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102629271A (zh) * | 2012-03-13 | 2012-08-08 | 北京工商大学 | 一种基于堆叠树图的复杂数据可视化方法及设备 |
CN103258061A (zh) * | 2013-06-09 | 2013-08-21 | 北京工商大学 | 一种基于插值算法的区域包围式超图可视化方法 |
CN103268389A (zh) * | 2013-06-09 | 2013-08-28 | 北京工商大学 | 一种基于插值算法的平滑曲线式超图可视化方法 |
-
2015
- 2015-10-05 CN CN201510640049.8A patent/CN105354223B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102629271A (zh) * | 2012-03-13 | 2012-08-08 | 北京工商大学 | 一种基于堆叠树图的复杂数据可视化方法及设备 |
CN103258061A (zh) * | 2013-06-09 | 2013-08-21 | 北京工商大学 | 一种基于插值算法的区域包围式超图可视化方法 |
CN103268389A (zh) * | 2013-06-09 | 2013-08-28 | 北京工商大学 | 一种基于插值算法的平滑曲线式超图可视化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105354223A (zh) | 2016-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105354223B (zh) | 一种针对非连续层次数据的可视化方法和应用 | |
CN106354760B (zh) | 基于变形统计地图的多视图时空数据可视化方法与应用 | |
Liu et al. | Visual analysis of route diversity | |
Hadlak et al. | A Survey of Multi-faceted Graph Visualization. | |
Kelleher et al. | Ten guidelines for effective data visualization in scientific publications | |
Nowosad et al. | Global assessment and mapping of changes in mesoscale landscapes: 1992–2015 | |
CN105653507B (zh) | 图表生成方法及装置 | |
CN105512218B (zh) | 一种关联层次数据的可视化方法和应用 | |
US9582573B2 (en) | Interactive composite plot for visualizing multi-variable data | |
Bernabeu Aubán et al. | Iberian Neolithic networks: the rise and fall of the Cardial World | |
Matsumoto et al. | Business connectivity, air transport and the urban hierarchy: A case study in East Asia | |
Yin et al. | 3D spatial-temporal GIS modeling of urban environments to support design and planning processes | |
CN105930461A (zh) | 实现关联信息节点可视化追踪的数据处理方法 | |
Sun et al. | A Web-based visual analytics system for real estate data | |
Pisati | Spatial Data Analysis in Stata an Overview | |
Kunz et al. | How to enhance cartographic visualisations of natural hazards assessment results | |
Azis et al. | Visualization Of Tourist Visit Time Series Data Using Google Data Studio | |
CN105808682A (zh) | 一种关系图展示的方法和装置 | |
CN108288505A (zh) | 一种可视分析的心理健康评估方法 | |
CN109923587A (zh) | 对地理热图上的感兴趣实体的地理定位 | |
de Leeuw et al. | Multi-level topology for flow visualization | |
Ho et al. | Implementation of a flow map demonstrator for analyzing commuting and migration flow statistics data | |
Jern et al. | Treemaps and choropleth maps applied to regional hierarchical statistical data | |
Wang et al. | Time-varying data visual analysis method based on parallel coordinate system | |
Xue et al. | Reducing ambiguities in line-based density plots by image-space colorization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |