CN106021245A - 数据的可视化方法和装置 - Google Patents

数据的可视化方法和装置 Download PDF

Info

Publication number
CN106021245A
CN106021245A CN201510118934.XA CN201510118934A CN106021245A CN 106021245 A CN106021245 A CN 106021245A CN 201510118934 A CN201510118934 A CN 201510118934A CN 106021245 A CN106021245 A CN 106021245A
Authority
CN
China
Prior art keywords
time
behavior
scattergram
distribution
column
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510118934.XA
Other languages
English (en)
Inventor
倪冰
袁明轩
兰亮
戴文渊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201510118934.XA priority Critical patent/CN106021245A/zh
Publication of CN106021245A publication Critical patent/CN106021245A/zh
Pending legal-status Critical Current

Links

Abstract

本发明提供一种数据的可视化方法和装置,该方法包括:获取网络用户的时空行为数据集;根据网络用户的时空行为数据集,确定目标种类的行为发生的次数随时间的分布;根据网络用户的时空行为数据集,确定目标地区内发生的行为的次数随时间的分布;利用显示设备在时间轴的一侧呈现第一分布图,并利用显示设备在时间轴的另一侧呈现第二分布图,第一分布图和第二分布图共用时间轴,且第一分布图表征目标种类的行为发生的次数随时间的分布,第二分布图表征目标地区内发生的行为的次数随时间的分布。本发明实施例中,通过一张图表征时间、行为、地区等多维信息,从而实现了时空行为数据的可视化。

Description

数据的可视化方法和装置
技术领域
本发明涉及数据可视化领域,并且更为具体地,涉及一种数据的可视化方法和装置。
背景技术
无线通讯技术的进步和智能终端设备的普及共同催生了大数据。每一部智能终端设备都是一个感应器,感应器上呈现前台服务(或称应用),并且连接后台。用户通过智能终端使用各种服务,各种服务的数据通过无线基站传输。无线基站传输的数据包含了用户和无线基站的连接信息、数据服务内容等等。这些数据被称为运营商的管道大数据。
因为管道大数据包含了用户使用移动终端服务时的连接和数据内容信息,可以从管道大数据演化出不同种类的多变量的时空行为数据。例如,时空行为数据可以被表述为<用户,时间,地点,区域,行为>五元组,其中时间可以是用户连接基站的时间,地点可以是用户连接的基站小区的标识,区域可以是用户连接的基站小区所在的区域的标识,行为则可包括用户所使用应用(即App),App小类,App大类等。因此,这个五元组信息实时地刻画了什么时候,什么地点,什么区域,什么人做什么事情的多元信息。举个最简单的例子一条记录为(353781047489****,2013-09-0523:49:04,10042_13851,天河区,QQ:IM),它表示用户353781047489****在2013-09-0523:49:04在基站10042_13851使用IM(Instant Messaging,即时通讯)类的应用程序QQ,这个基站10042_13851所在区域为天河区。具体地,从这个基站的语义地址“广东省广州市天河区建业路28号”中,可以抽取其他级别的区域信息,譬如“天河区建业路”。
多变量的时空行为数据包含了海量用户7x24小时时空行为信息。基于时空行为数据的可视分析可以支撑不同的业务,包括人口政策制定、疾病传播研究、和其他宏观调控领域。此外,多变量的时空行为数据还可应用于实时推荐和地域特定、时域特定、行为特定的商业推荐场景中,譬如店铺选址、APP推荐等。
多变量的时空行为数据包含有时域信息、地域信息和用户行为信息等多维度、相互独立又紧密联系的信息。如何实现时空行为数据的可视化是目前可视化领域亟待解决的问题。
发明内容
本发明实施例提供一种数据的可视化方法和装置,以解决时空行为数据的可视化问题。
第一方面,提供一种数据的可视化方法,包括:获取网络用户的时空行为数据集,所述时空行为数据集中每条时空行为数据记录了一个所述网络用户的一种行为以及该行为发生的时间和地点,且所述时空行为数据集中记录的行为包括目标种类的行为,所述时空行为数据集中记录的行为发生地点包括位于目标地区内的地点;根据所述网络用户的时空行为数据集,确定所述目标种类的行为发生的次数随时间的分布;根据所述网络用户的时空行为数据集,确定所述目标地区内发生的行为的次数随时间的分布;利用显示设备呈现时间轴;利用所述显示设备在所述时间轴的一侧呈现第一分布图,并利用所述显示设备在所述时间轴的另一侧呈现第二分布图,所述第一分布图和所述第二分布图共用所述时间轴,且所述第一分布图表征所述目标种类的行为发生的次数随时间的分布,所述第二分布图表征所述目标地区内发生的行为的次数随时间的分布。
结合第一方面,在第一方面的一种实现方式中,所述时间轴采用圆形的极坐标的形式,以表征一段周期性的时间。
结合第一方面或其上述实现方式的任一种,在第一方面的另一种实现方式中,所述利用所述显示设备在所述时间轴的一侧呈现第一分布图,包括:利用所述显示设备,在所述时间轴的圆周外侧呈现多个柱状条,以形成所述第一分布图,所述多个柱状条沿所述圆周间隔排布,且所述多个柱状条均沿所述时间轴的径向呈向外发散状,所述第一分布图通过多个柱状条的长度沿所述圆周的变化表征所述目标种类的行为发生的次数在所述周期性的时间内的分布。
结合第一方面或其上述实现方式的任一种,在第一方面的另一种实现方式中,所述目标种类的行为包括N种行为,所述多个柱状条中的每个柱状条由纹理不同的N个子柱状条依次纵向堆叠而成,所述第一分布图通过所述多个柱状条中的第i子柱状条的长度沿所述圆周的变化表征所述N种行为中的第i种行为发生的次数在所述周期性的时间内的分布,1≤i≤N。
结合第一方面或其上述实现方式的任一种,在第一方面的另一种实现方式中,所述利用所述显示设备在所述时间轴的另一侧呈现第二分布图,包括:利用所述显示设备,在所述时间轴的圆周内侧呈现封闭曲线,以形成所述第二分布图,所述第二分布图通过所述封闭曲线与所述圆周之间的径向距离的变化表征所述目标地区内发生的行为的次数在所述周期性的时间内的分布。
结合第一方面或其上述实现方式的任一种,在第一方面的另一种实现方式中,所述目标地区包括K个地区,所述封闭曲线与所述圆周线之间通过纹理不同的K个区域堆叠而成,其中,所述第二分布图通过所述K个区域中的第j区域沿所述径向距离的变化表征所述K个地区中的第j地区内发生的行为的次数在所述周期性的时间内的分布,1≤j≤K。
第二方面,提供一种数据的可视化装置,包括:获取单元,用于获取网络用户的时空行为数据集,所述时空行为数据集中每条时空行为数据记录了一个所述网络用户的一种行为以及该行为发生的时间和地点,且所述时空行为数据集中记录的行为包括目标种类的行为,所述时空行为数据集中记录的行为发生地点包括位于目标地区内的地点;第一确定单元,用于根据所述网络用户的时空行为数据集,确定所述目标种类的行为发生的次数随时间的分布;第二确定单元,用于根据所述网络用户的时空行为数据集,确定所述目标地区内发生的行为的次数随时间的分布;呈现单元,用于利用显示设备呈现时间轴,利用所述显示设备在所述时间轴的一侧呈现第一分布图,并利用所述显示设备在所述时间轴的另一侧呈现第二分布图,所述第一分布图和所述第二分布图共用所述时间轴,且所述第一分布图表征所述目标种类的行为发生的次数随时间的分布,所述第二分布图表征所述目标地区内发生的行为的次数随时间的分布。
结合第二方面,在第二方面的一种实现方式中,所述时间轴采用圆形的极坐标的形式,以表征一段周期性的时间。
结合第二方面或其上述实现方式的任一种,在第二方面的另一种实现方式中,所述呈现单元具体用于利用所述显示设备,在所述时间轴的圆周外侧呈现多个柱状条,以形成所述第一分布图,所述多个柱状条沿所述圆周间隔排布,且所述多个柱状条均沿所述时间轴的径向呈向外发散状,所述第一分布图通过多个柱状条的长度沿所述圆周的变化表征所述目标种类的行为发生的次数在所述周期性的时间内的分布。
结合第二方面或其上述实现方式的任一种,在第二方面的另一种实现方式中,所述目标种类的行为包括N种行为,所述多个柱状条中的每个柱状条由纹理不同的N个子柱状条依次纵向堆叠而成,所述第一分布图通过所述多个柱状条中的第i子柱状条的长度沿所述圆周的变化表征所述N种行为中的第i种行为发生的次数在所述周期性的时间内的分布,1≤i≤N。
结合第二方面或其上述实现方式的任一种,在第二方面的另一种实现方式中,所述呈现单元具体用于利用所述显示设备,在所述时间轴的圆周内侧呈现封闭曲线,以形成所述第二分布图,所述第二分布图通过所述封闭曲线与所述圆周之间的径向距离的变化表征所述目标地区内发生的行为的次数在所述周期性的时间内的分布。
结合第二方面或其上述实现方式的任一种,在第二方面的另一种实现方式中,所述目标地区包括K个地区,所述封闭曲线与所述圆周线之间通过纹理不同的K个区域堆叠而成,其中,所述第二分布图通过所述K个区域中的第j区域沿所述径向距离的变化表征所述K个地区中的第j地区内发生的行为的次数在所述周期性的时间内的分布,1≤j≤K。
本发明实施例中,表征行为次数随时间分布的第一分布图以及表征地区内发生的行为的次数随时间分布的第二分布图呈现在时间轴的两侧,并共用同一个时间轴,也就是说,通过共用时间轴的方式将两种包含不同信息的分布图共同呈现在一张图中,即通过一张图表征时间、行为、地区等多维信息,从而实现了时空行为数据的可视化。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的数据的可视化方法的示意性流程图。
图2是本发明实施例的显示设备上呈现的图形的示例图。
图3是时空行为数据的数据格式的示例图。
图4是本发明实施例的数据处理系统的示意性结构图。
图5是本发明实施例的数据筛选流程图。
图6是本发明实施例的数据渲染流程图。
图7是本发明实施例的数据筛选流程图。
图8是本发明实施例的数据渲染流程图。
图9是本发明实施例的可视化装置的示意性框图。
图10是本发明实施例的可视化装置的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
图1是本发明实施例的数据的可视化方法的示意性流程图。图1的方法包括:
101、获取网络用户的时空行为数据集,时空行为数据集中每条时空行为数据记录了一个网络用户的一种行为以及该行为发生的时间和地点,且时空行为数据集中记录的行为包括目标种类的行为,时空行为数据集中记录的行为发生地点包括位于目标地区内的地点。
应理解,步骤101中的网络用户可以指网络中的不特定的多个用户,而每条时空行为数据中记录的可以是该网络中的一个用户的一种行为以及该行为发生的时间和地点。
时空行为数据集包括多条时空行为数据,一条时空行为数据记录有网络用户的一种行为,该行为发生的时间,以及该行为发生的地点。例如,社交网络平台(比如,人人、微博等)的签到数据会记录用户在什么时间,什么地点,做了什么事。
需要说明的是,目标种类的行为可以包括一种行为,也可以包括多种行为,本发明实施例对此不作具体限定,可以根据实际希望研究的行为预先确定。
102、根据网络用户的时空行为数据集,确定目标种类的行为发生的次数随时间的分布。
具体地,步骤102可包括:从所述时空行为数据集中筛选出第一数据集,第一数据集中的时空行为数据均为目标种类的行为对应的时空行为数据;根据所述第一数据集,对所述目标种类的行为发生的时间进行统计分析,得到目标种类的行为发生的次数随时间的分布。需要说明的是,目标种类的行为发生的次数随时间的分布可用于指示目标种类的行为数量随时间的变化情况。
103、根据网络用户的时空行为数据集,确定目标地区内发生的行为的次数随时间的分布。
具体地,步骤103可包括:从所述时空行为数据集中筛选出第二数据集,所述第二数据集中的时空行为数据均为行为发生地点位于目标地区的行为对应的时空行为数据;根据第二数据集,对目标地区内发生的行为的时间进行统计分析,得到目标地区内发生的行为的次数随时间的分布。需要说明的是,目标地区内发生的行为的次数随时间的分布可用于指示目标地区内发生的行为数量随时间的变化情况。
104、利用显示设备呈现时间轴,并利用显示设备在时间轴的一侧呈现第一分布图,并利用显示设备在时间轴的另一侧呈现第二分布图,第一分布图和第二分布图共用时间轴,且第一分布图表征目标种类的行为发生的次数随时间的分布,第二分布图表征目标地区内发生的行为的次数随时间的分布。
本发明实施例对时间轴的形状,以及时间轴所表征的时间的范围不作具体限定,该时间轴可以是直线、曲线或封闭的环形;该时间轴表征的时间范围可以是一段周期内的时间,比如一天,一个星期,或者一个月,也可以是其他任意设置的时间,具体可以根据实际希望研究的时段自由设定。
应理解,本发明实施例对第一分布图和第二分布图的具体形式不作限定,例如,可以采用曲线图或直方图。
本发明实施例中,表征行为次数随时间分布的第一分布图以及表征地区内发生的行为的次数随时间分布的第二分布图呈现在时间轴的两侧,并共用同一个时间轴,也就是说,通过共用时间轴的方式将两种包含不同信息的分布图共同呈现在一张图中,即通过一张图表征时间、行为、地区等多维信息,从而实现了时空行为数据的可视化。
可选地,作为一个实施例,时间轴采用圆形的极坐标的形式,以表征一段周期性的时间。
如图2所示,圆形的极坐标将二维的平面空间分成两部分,即位于圆形的内侧的部分和位于圆形的外侧的部分。时间轴选用封闭圆形可以方便的表征连续的周期性的时间。此外,周期性的时间还可以是一个星期,一个月,一年等周期性的时间。
可选地,作为一个实施例,步骤104可包括:利用显示设备,在时间轴的圆周外侧呈现多个柱状条,以形成第一分布图,多个柱状条沿圆周间隔排布,且多个柱状条均沿时间轴的径向呈向外发散状,第一分布图通过多个柱状条的长度沿圆周的变化表征目标种类的行为发生的次数在周期性的时间内的分布。
如图2所示,圆形的极坐标外侧分布了许多长短不一的柱状条,由于圆形的极坐标表征一段周期性的时间,那么这个圆形的圆周线上的每个点可以对应该周期性的时间内的一个时刻。实际上,可以按照一定的粒度将该周期性的时间划分成多个时间段,并将时间轴的圆周线划分成与多个时间段一一对应的多段圆弧。然后可以以每段圆弧为起始位置,向外绘制一个柱状条,以形成上述多个柱状条,每个柱状条的长度表征落入这段圆弧对应的时间段内的行为的数量。由于柱状条的长短不一,也就说明不同时间段内目标行为的数量不同。通过圆周线上柱状条长度的变化也就可以直观地表征目标行为随时间的分布。例如,当时域跨度覆盖一天24小时,可以用圆形表征全时域的24小时,上端为0点,然后顺时针时间开始增长,到达圆形的底部为正午12点,回到圆形的上端则为24小时。应理解,时域粒度的选取可由可视分析目的所驱动。如果要做实时的群体分布,则时域粒度的选取可以在分钟级别,譬如5分钟一个时间段,则整个圆盘上被切分成288个圆弧线,分别对应288个时间段,以该288个圆弧线中的每个圆弧线为起点,向圆周外侧呈现一个柱状条,柱状条的长度表征对应时间段内目标行为的数量。柱状条通过彼此沿圆周线长短不一的分布形状表征了目标行为的数量随时间的变化情况。
可选地,作为一个实施例,目标种类的行为包括N种行为,多个柱状条中的每个柱状条由纹理不同的N个子柱状条依次纵向堆叠而成(换句话说,每个柱状条由纹理不同的N个子柱状条依次沿圆形时间轴的径向堆叠而成),第一分布图通过多个柱状条中的第i子柱状条的长度沿圆周的变化表征N种行为中的第i种行为发生的次数在周期性的时间内的分布,1≤i≤N。
如图2所示,图2中的柱状条k由子柱状条1、子柱状条2和子柱状条3堆叠而成,这三个子柱状条纹理不同,分别表征3种行为。由于多个柱状条均按照同样的方式堆叠而成,从图2中可以清晰地看出该3种行为中的每种行为数量随时间的分布情况。
可选地,作为一个实施例,步骤104可包括:利用显示设备,在时间轴的圆周内侧呈现封闭曲线,以形成第二分布图,第二分布图通过封闭曲线与圆周之间的径向距离的变化表征目标地区内发生的行为的次数在周期性的时间内的分布。
如图2所示,圆形的极坐标内部黑白交界处为一条封闭曲线,这条封闭曲线的有些区段距离(指径向距离)圆周线远,该封闭曲线上的有些区段距离圆周线近。例如,时间段1和时间段2是两个不同的时间段,封闭曲线在这两个时间段与圆周线的径向距离分别为径向距离1和径向距离2,从图2可以看出,径向距离1大于径向距离2,表征目标地区中,发生在时间段1内的行为的次数多于发生在时间段2内的行为的次数。
可选地,作为一个实施例,目标地区包括K个地区,封闭曲线与圆周线之间通过纹理不同的K个区域堆叠而成,其中,第二分布图通过K个区域中的第j区域沿径向距离的变化表征K个地区中的第j地区内发生的行为的次数在周期性的时间内的分布,1≤j≤K。
如图2所示,在时间轴的圆周内部,封闭曲线与圆周线之间是通过3个不同纹理的区域堆叠而成的,即区域1、区域2和区域3。这3个区域分别对应第1地区、第2地区和第3地区,其中第i区域沿径向距离的变化表征在第i地区内发生的行为数量随时间的变化情况,3个区域整体上沿径向距离的变化表征3个地区内发生的总行为数量随时间的变化情况。
需要说明的是,时空行为数据通常包括时间、空间、行为三个维度的信息,但时空行为数据的具体形式多种多样,可以采用数据处理、渲染和呈现等方式对时空行为数据进行处理,实现时空行为数据的呈现。下面结合图3至图8,以时空行为数据包括五元组,即<时间,地点,区域,行为,用户>为例,详细描述时空行为数据的数据收集至数据呈现的过程。应理解,以下仅仅是本发明的一个例子,而非要将本发明实施例限于所例示的具体数值或具体场景。本领域技术人员根据所给出的图3至图8的例子,显然可以进行各种等价的修改或变化,这样的修改或变化也落入本发明实施例的范围内。
首先,定义时空行为数据的数据模型,即定义五元组的含义。时空行为数据可包括<时间,地点,区域,行为,用户>五元组,其中地点可以是用户所在的物理位置,区域可以是这个地点所属的区域。行为可分为广义行为和狭义行为,广义行为可包括用户的社交行为,狭义行为可包括用户在智能终端上所使用应用(App),App小类,App大类。图3描述了数据模型100,将数据模型100分为四个层次,时域层次120,地域层次140,行为层次160,和用户层次180。由虚线段131,132,133组成的折线贯穿上述四个层次,其所代表的五元组<时间121,地点141,区域142,行为161,用户181>为一条时空行为数据。
接下来结合图4,描述对时空行为数据进行处理的装置的各模块。图4中的装置200可包括三个模块,数据存储210,数据渲染230,和用户交互240。数据存储210包括(1)数据模型100,定义了时空行为数据的五元组<时间,地点,区域,行为,用户>,(2)原始数据211,原始数据211为包含上述五元组的若干数据记录的集合,以及(3)从原始数据211中抽取出的五元组集合212,描述了若干五元组<时间,地点,区域,行为,用户>记录。数据渲染230是在获取到的五元组集合212基础上进行数据渲染的模块,包含三个渲染步骤,(1)渲染时间轴231,(2)渲染行为数量随时间的分布400,和(3)渲染区域内的行为数量随时间的分布600。然后,用户交互240,可以接受用户提交的查询241,并呈现数据渲染模块的渲染结果。
具体地,在数据存储210中,数据模型100定义了时空行为数据的五元组<时间,地点,区域,行为,用户>,原始数据211则是包含上述五元组的若干数据记录的集合。从原始数据211中抽取出五元组集合212,即若干五元组<时间,地点,区域,行为,用户>记录的集合。需要说明的是,上述数据格式仅仅是举例说明,并非要将本发明实施例限定在处理该特定数据格式的时空行为数据中。
数据渲染230分为渲染时间轴231、渲染行为数量随时间的分布400和渲染区域内的行为数量随时间的分布600三部分。渲染时间轴231所使用的图形可以是任何一条直线,一条曲线,或者一个封闭的环形。考虑到时域是一个连续特征,要有效描述这一连续特征,本发明实施例可以将其离散化,也即:在渲染时间轴231所使用的图形上划分若干的界分点,每一界分点对应一个时间段。这种界分方法通常可以选取一个合适的时域粒度,然后将整个时域跨度分配到若干时域粒度上。
渲染时间轴231之后,可以基于已渲染好的时间轴渲染行为数量随时间的分布400,以及渲染区域内的行为数量随时间的分布600。由于这两种分布共用一个时间轴,因此,对该两种分布也可使用与时间轴相同的界分方式,例如,时间轴表征24小时,以5分钟为一个界分点,表征行为数量随时间的分布的第一分布图和表征区域内的行为数量随时间的分布的第二分布图也均可以以5分钟为一个界分点。
行为数量随时间的分布可以通过n元组集合表示,该集合中的每一条记录有n条时间和行为的对应关系,即记录<时间,行为1,行为1数量,…,行为n,行为n数量>,以表示在某一时间上的所有行为及其行为数量。渲染时域上行为数量的分布之前,需要进行渲染时域上行为分布所需n元组集合的筛选和抽取,下面结合图5详细描述这一数据筛选和抽取过程。
图5是时域上行为分布的数据筛选和抽取过程300,其描述了从五元组记录集合212到形成行为数量随时间的分布380的过程。对于五元组集合212中任意一条五元组记录<时间,地点,区域,行为,用户>,应用筛选条件<时域,地点,区域,行为>250,做基于筛选条件的判断,包括时域筛选过程,该过程包括步骤320、步骤321和步骤322,<地点,区域>筛选过程,该过程包括步骤330、步骤331和步骤332,以及行为筛选过程,包括步骤340、步骤341和步骤342。具体地,在筛选记录i的过程中,只要有一次判断进入分支322、分支332或者分支342,则该记录被舍弃;相反,则保留记录中的二元组<时间,行为>,即执行步骤350。到这里为止,完成对一条记录的筛选。
判断是否对所有记录执行了上述筛选过程,即执行步骤360。如果否,则进入分支361;如果已经完成所有记录上的筛选,则进入分支362,执行步骤370,即基于步骤350记录的二元组<时间,行为>350的集合,针对不同行为做聚合统计。最终输出行为数量随时间的分布380,其为n元组集合,每一条记录描述为<时间,行为1,行为1数量,。。。,行为n,行为n数量>。到这里为止,完成对所有记录的筛选和抽取300。
图6描述行为数量随时间的分布的渲染过程400。对n元组集合380中的每一条n元组记录r<时间,行为1,行为1数量,…,行为n,行为n数量>,确定记录r所对应的时间在时间轴231上所属的时间段i,即图6中的步骤410。在时间轴231的时间段i上渲染<行为j,行为j数量>,即执行步骤420,步骤420的具体实施方式可以是:将时间轴的延伸视为水平方向,在时间段i对应界分点上向垂直方向做延伸,这个延伸带有二维信息<行为j,行为j数量>;用特定纹理表征行为,用这个纹理延伸长度表征行为的数量。到这里为止,完成对记录r所对应时间段i上行为j的渲染。
判断记录r上所有行为是否渲染完毕,即执行步骤430。如果否,则执行分支431,继续在未渲染的行为上执行上述渲染过程。应理解,不同的行为可以使用不同纹理表征。如果已完成记录r上所有行为的渲染,则执行分支432,到这里为止记录r的渲染完成。
判断n元组集合380中所有记录是否渲染完毕,即执行步骤440。如果否,则执行分支441,继续在未渲染的记录上执行上述渲染过程。需要说明的是,不同记录中的行为j在时间段i上出现的话,在已渲染的行为j上继续叠加其延伸长度。如果已完成所有记录的渲染,则行为数量随时间的分布的渲染过程完成。
区域内的行为随时间的分布可以通过n元组集合表示,该n元组集合中的每一条记录<时间,区域1,区域1行为数量,。。。,区域m,区域m行为数量>,以表示在某一时间上的所有区域及其区域上的行为数量。渲染时域上地域分布600之前,要完成对时域上地域分布数据筛选和抽取过程。下面结合图7详细描述该数据筛选和抽取过程。
图7是区域内的行为随时间的分布所需的n元组集合的数据筛选过程500,其描述了从五元组记录集合212到形成区域内的行为随时间的分布580的过程。对于五元组记录集合212中任意一条五元组记录<时间,地点,区域,区域,用户>,应用筛选条件<时域,地点,区域,行为>250,做基于筛选条件的判断,包括时域筛选过程,包括步骤520、步骤521和步骤522,<地点,区域>筛选过程,包括步骤530、步骤531和步骤532,以及行为筛选过程,包括步骤560、步骤561和步骤562。在筛选记录i的过程中,只要有其中一次判断进入分支522,分支532或者分支562,则该记录被舍弃;相反,保留该记录中的三元组<时间,区域,行为>530。到这里为止,完成对一条记录的筛选。
判断是否对所有记录执行了上述筛选过程,即执行步骤560。如果否,则进入分支561;如果已经完成所有记录上的筛选,则进入分支562,执行步骤570,即基于步骤550保留的三元组<时间,区域,行为>530的集合,对不同区域做聚合统计,最终输出区域内的行为随时间的分布,即执行步骤580,其为一个n元组集合,每一条记录描述<时间,区域1,区域1行为数量,…,区域m,区域m行为数量>。
图8描述区域内的行为随时间的分布580的渲染过程600。对每一条n元组记录r<时间,区域1,区域1行为数量,。。。,区域m,区域m行为数量>,确定记录r所对应的时间在时间轴231上所属的时间段i,即执行步骤610。在时间轴231的时间段i上渲染<区域j,区域j行为数量>,即执行步骤620,步骤620的具体实施方式可以包括:将时间轴的延伸视为水平方向,在时间段i对应坐标点上向垂直方向做延伸,这个延伸方向与渲染行为数量随时间分布400所使用的方向相反。同样地,这个延伸带有二维信息<区域j,区域j行为数量>,用不同纹理表征不同区域,用纹理的延伸长度表征行为数量。到这里为止,完成对记录r所对应时间段i上区域j的渲染。
判断记录r上所有区域是否渲染完毕,即执行步骤630。如果否,则进入分支631。应理解,不同的区域可以使用不同纹理表征。如果已完成记录r上所有区域的渲染,则进入分支632,到这里为止记录r的渲染完成。
判断n元组集合580中所有记录是否渲染完毕640。如果否,进入分支641,则继续在未渲染的记录上执行上述渲染过程610-640。需要说明的是,不同记录中的区域j在时间段i上出现的话,在已渲染的区域j上继续叠加其延伸长度。如果已完成所有记录的渲染,到这里为止时域上区域分布580的渲染完成。
用户交互240可实现两个任务:(1)接受用户提交查询241,以及(2)呈现图谱700,该图谱可包括上述时间轴、表征行为数量随时间的分布的第一分布图,以及表征区域内的行为随时间的分布的第二分布图。
具体地,如图4所示,用户交互240可以接受的查询条件可包括时域查询,地域查询和行为查询,并返回查询筛选条件<时域,地域,行为>250给五元组集合212。在无特定筛选条件指定的情形下,数据渲染230可以基于五元组集合212中的所有数据。在指定特定筛选条件下,数据渲染230可以基于筛选条件在五元组集合212上做渲染。这个筛选在时域上行为分布数据筛选和抽取300和时域上地域分布数据筛选和抽取500参见图5和图7。
上文结合图1-图8,详细描述了根据本发明实施例的数据的可视化方法,下文结合图9至图10,详细描述根据本发明实施例的可视化装置。应理解,图9和图10中的可视化装置均能实现图1中的各个步骤,为避免重复,此处不再详述。
图9是本发明实施例的可视化装置的示意性框图。图9的可视化装置900包括:
获取单元910,用于获取网络用户的时空行为数据集,所述时空行为数据集中每条时空行为数据记录了一个所述网络用户的一种行为以及该行为发生的时间和地点,且所述时空行为数据集中记录的行为包括目标种类的行为,所述时空行为数据集中记录的行为发生地点包括位于目标地区内的地点;
第一确定单元920,用于根据所述网络用户的时空行为数据集,确定所述目标种类的行为发生的次数随时间的分布;
第二确定单元930,用于根据所述网络用户的时空行为数据集,确定所述目标地区内发生的行为的次数随时间的分布;
呈现单元940,用于利用显示设备呈现时间轴,利用所述显示设备在所述时间轴的一侧呈现第一分布图,并利用所述显示设备在所述时间轴的另一侧呈现第二分布图,所述第一分布图和所述第二分布图共用所述时间轴,且所述第一分布图表征所述目标种类的行为发生的次数随时间的分布,所述第二分布图表征所述目标地区内发生的行为的次数随时间的分布。
本发明实施例中,表征行为次数随时间分布的第一分布图以及表征地区内发生的行为的次数随时间分布的第二分布图呈现在时间轴的两侧,并共用同一个时间轴,也就是说,通过共用时间轴的方式将两种包含不同信息的分布图共同呈现在一张图中,即通过一张图表征时间、行为、地区等多维信息,从而实现了时空行为数据的可视化。
可选地,作为一个实施例,所述时间轴采用圆形的极坐标的形式,以表征一段周期性的时间。
可选地,作为一个实施例,所述呈现单元940具体用于利用所述显示设备,在所述时间轴的圆周外侧呈现多个柱状条,以形成所述第一分布图,所述多个柱状条沿所述圆周间隔排布,且所述多个柱状条均沿所述时间轴的径向呈向外发散状,所述第一分布图通过多个柱状条的长度沿所述圆周的变化表征所述目标种类的行为发生的次数在所述周期性的时间内的分布。
可选地,作为一个实施例,所述目标种类的行为包括N种行为,所述多个柱状条中的每个柱状条由纹理不同的N个子柱状条依次纵向堆叠而成,所述第一分布图通过所述多个柱状条中的第i子柱状条的长度沿所述圆周的变化表征所述N种行为中的第i种行为发生的次数在所述周期性的时间内的分布,1≤i≤N。
可选地,作为一个实施例,所述呈现单元940具体用于利用所述显示设备,在所述时间轴的圆周内侧呈现封闭曲线,以形成所述第二分布图,所述第二分布图通过所述封闭曲线与所述圆周之间的径向距离的变化表征所述目标地区内发生的行为的次数在所述周期性的时间内的分布。
可选地,作为一个实施例,所述目标地区包括K个地区,所述封闭曲线与所述圆周线之间通过纹理不同的K个区域堆叠而成,其中,所述第二分布图通过所述K个区域中的第j区域沿所述径向距离的变化表征所述K个地区中的第j地区内发生的行为的次数在所述周期性的时间内的分布,1≤j≤K。
图10是本发明实施例的可视化装置的示意性框图。图10的可视化装置1000包括:
处理器1010,用于执行程序,当所述程序被执行时,所述处理器1010具体用于获取网络用户的时空行为数据集,所述时空行为数据集中每条时空行为数据记录了一个所述网络用户的一种行为以及该行为发生的时间和地点,且所述时空行为数据集中记录的行为包括目标种类的行为,所述时空行为数据集中记录的行为发生地点包括位于目标地区内的地点;根据所述网络用户的时空行为数据集,确定所述目标种类的行为发生的次数随时间的分布;根据所述网络用户的时空行为数据集,确定所述目标地区内发生的行为的次数随时间的分布;
显示器1020,用于呈现时间轴,在所述时间轴的一侧呈现第一分布图,并在所述时间轴的另一侧呈现第二分布图,所述第一分布图和所述第二分布图共用所述时间轴,且所述第一分布图表征所述目标种类的行为发生的次数随时间的分布,所述第二分布图表征所述目标地区内发生的行为的次数随时间的分布。
本发明实施例中,表征行为次数随时间分布的第一分布图以及表征地区内发生的行为的次数随时间分布的第二分布图呈现在时间轴的两侧,并共用同一个时间轴,也就是说,通过共用时间轴的方式将两种包含不同信息的分布图共同呈现在一张图中,即通过一张图表征时间、行为、地区等多维信息,从而实现了将时空行为数据的可视化。
可选地,作为一个实施例,所述时间轴采用圆形的极坐标的形式,以表征一段周期性的时间。
可选地,作为一个实施例,所述显示器1020具体用于在所述时间轴的圆周外侧呈现多个柱状条,以形成所述第一分布图,所述多个柱状条沿所述圆周间隔排布,且所述多个柱状条均沿所述时间轴的径向呈向外发散状,所述第一分布图通过多个柱状条的长度沿所述圆周的变化表征所述目标种类的行为发生的次数在所述周期性的时间内的分布。
可选地,作为一个实施例,所述目标种类的行为包括N种行为,所述多个柱状条中的每个柱状条由纹理不同的N个子柱状条依次纵向堆叠而成,所述第一分布图通过所述多个柱状条中的第i子柱状条的长度沿所述圆周的变化表征所述N种行为中的第i种行为发生的次数在所述周期性的时间内的分布,1≤i≤N。
可选地,作为一个实施例,所述显示器1020具体用于,在所述时间轴的圆周内侧呈现封闭曲线,以形成所述第二分布图,所述第二分布图通过所述封闭曲线与所述圆周之间的径向距离的变化表征所述目标地区内发生的行为的次数在所述周期性的时间内的分布。
可选地,作为一个实施例,所述目标地区包括K个地区,所述封闭曲线与所述圆周线之间通过纹理不同的K个区域堆叠而成,其中,所述第二分布图通过所述K个区域中的第j区域沿所述径向距离的变化表征所述K个地区中的第j地区内发生的行为的次数在所述周期性的时间内的分布,1≤j≤K。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (12)

1.一种数据的可视化方法,其特征在于,包括:
获取网络用户的时空行为数据集,所述时空行为数据集中每条时空行为数据记录了一个所述网络用户的一种行为以及该行为发生的时间和地点,且所述时空行为数据集中记录的行为包括目标种类的行为,所述时空行为数据集中记录的行为发生地点包括位于目标地区内的地点;
根据所述网络用户的时空行为数据集,确定所述目标种类的行为发生的次数随时间的分布;
根据所述网络用户的时空行为数据集,确定所述目标地区内发生的行为的次数随时间的分布;
利用显示设备呈现时间轴;
利用所述显示设备在所述时间轴的一侧呈现第一分布图,并利用所述显示设备在所述时间轴的另一侧呈现第二分布图,所述第一分布图和所述第二分布图共用所述时间轴,且所述第一分布图表征所述目标种类的行为发生的次数随时间的分布,所述第二分布图表征所述目标地区内发生的行为的次数随时间的分布。
2.如权利要求1所述的方法,其特征在于,所述时间轴采用圆形的极坐标的形式,以表征一段周期性的时间。
3.如权利要求2所述的方法,其特征在于,所述利用所述显示设备在所述时间轴的一侧呈现第一分布图,包括:
利用所述显示设备,在所述时间轴的圆周外侧呈现多个柱状条,以形成所述第一分布图,所述多个柱状条沿所述圆周间隔排布,且所述多个柱状条均沿所述时间轴的径向呈向外发散状,所述第一分布图通过多个柱状条的长度沿所述圆周的变化表征所述目标种类的行为发生的次数在所述周期性的时间内的分布。
4.如权利要求3所述的方法,其特征在于,所述目标种类的行为包括N种行为,所述多个柱状条中的每个柱状条由纹理不同的N个子柱状条依次纵向堆叠而成,所述第一分布图通过所述多个柱状条中的第i子柱状条的长度沿所述圆周的变化表征所述N种行为中的第i种行为发生的次数在所述周期性的时间内的分布,1≤i≤N。
5.如权利要求2-4中任一项所述的方法,其特征在于,所述利用所述显示设备在所述时间轴的另一侧呈现第二分布图,包括:
利用所述显示设备,在所述时间轴的圆周内侧呈现封闭曲线,以形成所述第二分布图,所述第二分布图通过所述封闭曲线与所述圆周之间的径向距离的变化表征所述目标地区内发生的行为的次数在所述周期性的时间内的分布。
6.如权利要求5所述的方法,其特征在于,所述目标地区包括K个地区,所述封闭曲线与所述圆周线之间通过纹理不同的K个区域堆叠而成,其中,所述第二分布图通过所述K个区域中的第j区域沿所述径向距离的变化表征所述K个地区中的第j地区内发生的行为的次数在所述周期性的时间内的分布,1≤j≤K。
7.一种数据的可视化装置,其特征在于,包括:
获取单元,用于获取网络用户的时空行为数据集,所述时空行为数据集中每条时空行为数据记录了一个所述网络用户的一种行为以及该行为发生的时间和地点,且所述时空行为数据集中记录的行为包括目标种类的行为,所述时空行为数据集中记录的行为发生地点包括位于目标地区内的地点;
第一确定单元,用于根据所述网络用户的时空行为数据集,确定所述目标种类的行为发生的次数随时间的分布;
第二确定单元,用于根据所述网络用户的时空行为数据集,确定所述目标地区内发生的行为的次数随时间的分布;
呈现单元,用于利用显示设备呈现时间轴,利用所述显示设备在所述时间轴的一侧呈现第一分布图,并利用所述显示设备在所述时间轴的另一侧呈现第二分布图,所述第一分布图和所述第二分布图共用所述时间轴,且所述第一分布图表征所述目标种类的行为发生的次数随时间的分布,所述第二分布图表征所述目标地区内发生的行为的次数随时间的分布。
8.如权利要求7所述的装置,其特征在于,所述时间轴采用圆形的极坐标的形式,以表征一段周期性的时间。
9.如权利要求8所述的装置,其特征在于,所述呈现单元具体用于利用所述显示设备,在所述时间轴的圆周外侧呈现多个柱状条,以形成所述第一分布图,所述多个柱状条沿所述圆周间隔排布,且所述多个柱状条均沿所述时间轴的径向呈向外发散状,所述第一分布图通过多个柱状条的长度沿所述圆周的变化表征所述目标种类的行为发生的次数在所述周期性的时间内的分布。
10.如权利要求9所述的装置,其特征在于,所述目标种类的行为包括N种行为,所述多个柱状条中的每个柱状条由纹理不同的N个子柱状条依次纵向堆叠而成,所述第一分布图通过所述多个柱状条中的第i子柱状条的长度沿所述圆周的变化表征所述N种行为中的第i种行为发生的次数在所述周期性的时间内的分布,1≤i≤N。
11.如权利要求8-10中任一项所述的装置,其特征在于,所述呈现单元具体用于利用所述显示设备,在所述时间轴的圆周内侧呈现封闭曲线,以形成所述第二分布图,所述第二分布图通过所述封闭曲线与所述圆周之间的径向距离的变化表征所述目标地区内发生的行为的次数在所述周期性的时间内的分布。
12.如权利要求11所述的装置,其特征在于,所述目标地区包括K个地区,所述封闭曲线与所述圆周线之间通过纹理不同的K个区域堆叠而成,其中,所述第二分布图通过所述K个区域中的第j区域沿所述径向距离的变化表征所述K个地区中的第j地区内发生的行为的次数在所述周期性的时间内的分布,1≤j≤K。
CN201510118934.XA 2015-03-18 2015-03-18 数据的可视化方法和装置 Pending CN106021245A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510118934.XA CN106021245A (zh) 2015-03-18 2015-03-18 数据的可视化方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510118934.XA CN106021245A (zh) 2015-03-18 2015-03-18 数据的可视化方法和装置

Publications (1)

Publication Number Publication Date
CN106021245A true CN106021245A (zh) 2016-10-12

Family

ID=57082357

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510118934.XA Pending CN106021245A (zh) 2015-03-18 2015-03-18 数据的可视化方法和装置

Country Status (1)

Country Link
CN (1) CN106021245A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107656956A (zh) * 2017-03-14 2018-02-02 上海墨翎数据科技有限公司 一种智慧环保大数据可视化方法
CN108089785A (zh) * 2017-11-24 2018-05-29 浙江大学 一种基于可达性的可视化住址选取系统
CN110188886A (zh) * 2018-08-17 2019-08-30 第四范式(北京)技术有限公司 对机器学习过程的数据处理步骤进行可视化的方法和系统
CN111353743A (zh) * 2020-03-03 2020-06-30 深圳前海微众银行股份有限公司 仓库可视化方法、装置、设备及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107656956A (zh) * 2017-03-14 2018-02-02 上海墨翎数据科技有限公司 一种智慧环保大数据可视化方法
CN108089785A (zh) * 2017-11-24 2018-05-29 浙江大学 一种基于可达性的可视化住址选取系统
CN108089785B (zh) * 2017-11-24 2020-01-21 浙江大学 一种基于可达性的可视化住址选取系统
CN110188886A (zh) * 2018-08-17 2019-08-30 第四范式(北京)技术有限公司 对机器学习过程的数据处理步骤进行可视化的方法和系统
CN110188886B (zh) * 2018-08-17 2021-08-20 第四范式(北京)技术有限公司 对机器学习过程的数据处理步骤进行可视化的方法和系统
CN111353743A (zh) * 2020-03-03 2020-06-30 深圳前海微众银行股份有限公司 仓库可视化方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110019396B (zh) 一种基于分布式多维分析的数据分析系统及方法
CN101990003B (zh) 一种基于ip地址属性的用户行为监控系统与方法
Xie et al. Simulating emergent urban form using agent-based modeling: Desakota in the Suzhou-Wuxian region in China
Zheng et al. A cloud-based knowledge discovery system for monitoring fine-grained air quality
Yang et al. An improved artificial bee colony algorithm for optimal land-use allocation
CN103138986A (zh) 一种基于可视分析的网站异常访问行为的检测方法
Lin et al. Simulating urban growth in a metropolitan area based on weighted urban flows by using web search engine
CN106682212A (zh) 一种基于用户移动行为的社会关系分类方法与装置
Duvvuru et al. Undercovering research trends: Network analysis of keywords in scholarly articles
CN102147807A (zh) 基于gis的海量雷电数据时空分析方法
CN106021245A (zh) 数据的可视化方法和装置
CN105096057A (zh) 权力运行与预防腐败的监察模型系统
CN105447723A (zh) 推广系统与推广方法
CN107909376A (zh) 一种电力系统用户满意度反馈系统
CN106886517A (zh) 业务选址方法、装置以及系统
Yang et al. East Asia and solar energy trade network patterns
CN106202398A (zh) 一种索引建立的方法及装置
CN107276854A (zh) 一种大数据下molap统计分析的方法
CN114218291A (zh) 基于目标对象的画像生成方法、装置、设备及存储介质
CN100578499C (zh) 一种联机分析处理系统中多维数据读写的方法和装置
CN104299065B (zh) 一种调度自动化主备系统间模型正确性校验的方法
CN109522336A (zh) 一种基于电子政务内网信息资源的决策分析系统及方法
CN108875032A (zh) 区域类型确定方法及装置
CN108537441A (zh) 土地利用转型经济社会效应评价与监控信息集成系统
CN116993555A (zh) 国土空间规划重点区域识别的分区方法、系统及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20161012

WD01 Invention patent application deemed withdrawn after publication