CN115269945A - 大数据可视化分析方法及装置 - Google Patents

大数据可视化分析方法及装置 Download PDF

Info

Publication number
CN115269945A
CN115269945A CN202211194432.1A CN202211194432A CN115269945A CN 115269945 A CN115269945 A CN 115269945A CN 202211194432 A CN202211194432 A CN 202211194432A CN 115269945 A CN115269945 A CN 115269945A
Authority
CN
China
Prior art keywords
data
visualization
interpolated
grid
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211194432.1A
Other languages
English (en)
Other versions
CN115269945B (zh
Inventor
张煇
李龙
韩鑫磊
朱晓娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Changhe Digital Intelligence Technology Co ltd
Changhe Information Co ltd
Original Assignee
Shanxi Changhe Technology Co ltd
Beijing Changhe Digital Intelligence Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanxi Changhe Technology Co ltd, Beijing Changhe Digital Intelligence Technology Co ltd filed Critical Shanxi Changhe Technology Co ltd
Priority to CN202211194432.1A priority Critical patent/CN115269945B/zh
Publication of CN115269945A publication Critical patent/CN115269945A/zh
Application granted granted Critical
Publication of CN115269945B publication Critical patent/CN115269945B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Generation (AREA)
  • Complex Calculations (AREA)

Abstract

本发明涉及数据处理技术领域,一种大数据可视化方法及装置,包括:获取待可视化的数据集,构建三维坐标系并根据数据集在三维坐标系中构建初始可视化网格,依次计算在三维坐标系中每组二维形式数据的波动率,根据波动率选择出需执行插值处理的数据组得到待插值数据集,对所述待插值数据集执行插值计算得到多组插值数据,提高与每组插值数据对应的初始可视化网格的分辨率得到弱化可视化网格,将每组插值数据插入至对应的弱化可视化网格后,根据每个弱化可视化网格及初始可视化网格生成与待可视化的数据集对应的可视化热图。本发明可以提高可视化过程的智能性并规避资源浪费的问题。

Description

大数据可视化分析方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种大数据可视化分析方法、装置、电子设备及计算机可读存储介质。
背景技术
数据可视化是一种化繁为简,借助图形化的手段将数据赋予了可视化价值,不仅增加了数据的灵动性,也能帮助数据分析者更快发现数据趋势,意义重大。
目前数据可视化方法主要基于Python或MATLAB等工具先接收待可视化的数据集,然后通过内部的函数实现数据的图表化。这种方法普及性很高,具有重要意义。但由于传统的Python或MATLAB等工具实现可视化时并未考虑数据密度问题,仅是固化的根据输入数据形成图表,智能性不高,且生成图表的所有像素均相同,容易造成资源浪费。
发明内容
本发明提供一种大数据可视化分析方法、装置及计算机可读存储介质,其主要目的在于提高可视化过程的智能性并规避资源浪费的问题。
为实现上述目的,本发明提供的一种大数据可视化分析方法,包括:
获取待可视化的数据集,所述数据集由三元组
Figure 179135DEST_PATH_IMAGE001
组成,其中,
Figure 557027DEST_PATH_IMAGE002
表示数据集中第
Figure 859570DEST_PATH_IMAGE003
个数据的数据生成时间,
Figure 57333DEST_PATH_IMAGE004
表示时间
Figure 604989DEST_PATH_IMAGE002
下第
Figure 571808DEST_PATH_IMAGE003
组数据的二维形式的数据值;
构建与三元组形式对应的三维坐标系,并根据所述数据集在三维坐标系中构建初始可视化网格,每个初始可视化网格的分辨率为:
Figure 546718DEST_PATH_IMAGE005
Figure 966198DEST_PATH_IMAGE006
其中,
Figure 317544DEST_PATH_IMAGE007
表示时间
Figure 138870DEST_PATH_IMAGE002
下第
Figure 48795DEST_PATH_IMAGE003
组数据对应的初始可视化网格的分辨率,
Figure 955571DEST_PATH_IMAGE008
为预设的最大分辨率,
Figure 845030DEST_PATH_IMAGE009
表示第
Figure 786441DEST_PATH_IMAGE003
组所有二维形式数据所构成的函数关系,
Figure 103153DEST_PATH_IMAGE010
表示函数关系
Figure 497225DEST_PATH_IMAGE009
Figure 987112DEST_PATH_IMAGE011
求偏导后在
Figure 783030DEST_PATH_IMAGE012
的偏导值,
Figure 536222DEST_PATH_IMAGE010
表示函数关系
Figure 916126DEST_PATH_IMAGE009
Figure 147387DEST_PATH_IMAGE013
求偏导后在
Figure 797811DEST_PATH_IMAGE014
的偏导值,
Figure 721905DEST_PATH_IMAGE015
表示时间
Figure 824990DEST_PATH_IMAGE002
下生成的所有数据的总组数,
Figure 859942DEST_PATH_IMAGE016
表示时间
Figure 364873DEST_PATH_IMAGE002
下所有
Figure 459868DEST_PATH_IMAGE011
的数据总值,
Figure 820223DEST_PATH_IMAGE017
表示时间
Figure 393286DEST_PATH_IMAGE002
下所有
Figure 18303DEST_PATH_IMAGE013
的数据总值;
依次计算在三维坐标系中每组二维形式数据的波动率;
根据波动率选择出需执行插值处理的数据组,得到待插值数据集;
对所述待插值数据集执行插值计算得到多组插值数据,提高与每组插值数据对应的初始可视化网格的分辨率,得到弱化可视化网格,将每组插值数据插入至对应的弱化可视化网格后,根据每个弱化可视化网格及初始可视化网格生成与待可视化的数据集对应的可视化热图,其中可视化热图的颜色强弱由弱化可视化网格及初始可视化网格的分辨率决定。
可选地,根据所述数据集在三维坐标系中构建初始可视化网格,包括:
将所述数据集按照数据生成时间的先后顺序执行排列,得到具有时间顺序的数据集;
依次将具有时间顺序的数据集中每组二维形式的数据值投射到所述三维坐标系中;
以投射到三维坐标系的每个数据作为中心生成与其对应的初始可视化网格。
可选地,所述依次计算在三维坐标系中每组二维形式数据的波动率,包括:
采用如下公式计算得到波动率:
Figure 284199DEST_PATH_IMAGE018
Figure 361877DEST_PATH_IMAGE019
Figure 4210DEST_PATH_IMAGE020
其中,
Figure 483733DEST_PATH_IMAGE021
表示第
Figure 186110DEST_PATH_IMAGE003
组所有二维形式数据的波动率,
Figure 249619DEST_PATH_IMAGE022
表示第
Figure 898906DEST_PATH_IMAGE003
组所有x形式数据的波动率,
Figure 498515DEST_PATH_IMAGE023
表示第
Figure 106213DEST_PATH_IMAGE003
组所有y形式数据的波动率,
Figure 158483DEST_PATH_IMAGE024
表示第
Figure 877040DEST_PATH_IMAGE003
组所有x形式数据的平均值,
Figure 331155DEST_PATH_IMAGE025
表示第
Figure 375335DEST_PATH_IMAGE003
组所有y形式数据的平均值,
Figure 413436DEST_PATH_IMAGE026
表示第
Figure 935684DEST_PATH_IMAGE003
组数据的数据总量。
可选地,所述根据波动率选择出需执行插值处理的数据组,得到待插值数据集,包括:
接收设定的第一波动阈值和第二波动阈值,其中第二波动阈值大于第一波动阈值;
依次判断每组波动率与第一波动阈值和第二波动阈值的大小关系;
将波动率小于第一波动阈值的数据组设置成直接可视化数据集;
将波动率大于或等于第一波动阈值,但小于第二波动阈值的数据组设置成第一待插值数据集;
将波动率大于或等于第二波动阈值的数据组设置成第二待插值数据集,其中第一待插值数据集和第二待插值数据集统称为所述待插值数据集。
可选地,所述对所述待插值数据集执行插值计算得到多组插值数据,包括:
依次从所述第一待插值数据集中提取数据生成时间相邻的两组待插值数据;
根据下式计算得到相邻两组待插值数据的插值数据,其中插值数据为二维形式,包括
Figure 978726DEST_PATH_IMAGE011
值和
Figure 928228DEST_PATH_IMAGE013
值:
Figure 689510DEST_PATH_IMAGE027
其中,
Figure 15450DEST_PATH_IMAGE028
Figure 178578DEST_PATH_IMAGE029
表示第一待插值数据集中第
Figure 298980DEST_PATH_IMAGE030
组待插值数据和第
Figure 311673DEST_PATH_IMAGE031
组待插值数据在三维坐标系中的
Figure 972462DEST_PATH_IMAGE011
值,
Figure 990097DEST_PATH_IMAGE032
Figure 546980DEST_PATH_IMAGE033
表示第一待插值数据集中第
Figure 282855DEST_PATH_IMAGE030
组待插值数据和第
Figure 685017DEST_PATH_IMAGE031
组待插值数据在三维坐标系中的
Figure 557158DEST_PATH_IMAGE013
值,
Figure 284943DEST_PATH_IMAGE034
为设定的处于第
Figure 242534DEST_PATH_IMAGE030
组和第
Figure 230080DEST_PATH_IMAGE031
组之间的
Figure 222307DEST_PATH_IMAGE011
值,
Figure 855414DEST_PATH_IMAGE035
表示以
Figure 565881DEST_PATH_IMAGE036
为两组待插值数据的前提下
Figure 575425DEST_PATH_IMAGE034
对应的
Figure 422158DEST_PATH_IMAGE013
值;
对所述第二待插值数据集中每组待插值数据执行牛顿插值法,得到对应的插值数据。
可选地,所述提高与每组插值数据对应的初始可视化网格的分辨率,得到弱化可视化网格,包括:
根据初始可视化网格的分辨率计算方法,计算出插值数据的初始可视化网格的分辨率;
根据插值数据中
Figure 491746DEST_PATH_IMAGE011
值和
Figure 423930DEST_PATH_IMAGE013
值计算得到弱化率;
根据弱化率降低插值数据初始可视化网格的分辨率,得到所述弱化可视化网格。
可选地,所述根据插值数据中
Figure 735700DEST_PATH_IMAGE011
值和
Figure 702519DEST_PATH_IMAGE013
值计算得到偏差率,包括:
根据下式计算得到偏差率:
Figure 474166DEST_PATH_IMAGE037
其中,
Figure 362487DEST_PATH_IMAGE038
表示插值数据中的
Figure 713834DEST_PATH_IMAGE011
值,
Figure 331897DEST_PATH_IMAGE039
表示插值数据中的
Figure 477708DEST_PATH_IMAGE013
值,
Figure 384484DEST_PATH_IMAGE040
表示插值数据的偏差率。
可选地,所述根据弱化率降低插值数据初始可视化网格的分辨率,得到所述弱化可视化网格,包括:
采用如下公式计算得到弱化可视化网格的分辨率
Figure 539522DEST_PATH_IMAGE041
其中,
Figure 713889DEST_PATH_IMAGE042
表示时间
Figure 296180DEST_PATH_IMAGE002
下第
Figure 690252DEST_PATH_IMAGE030
组插值数据对应的弱化可视化网格的分辨率,
Figure 117823DEST_PATH_IMAGE043
表示时间
Figure 913740DEST_PATH_IMAGE002
下第
Figure 666933DEST_PATH_IMAGE030
组插值数据对应的初始可视化网格的分辨率。
可选地,所述待可视化的数据集的三元组
Figure 282722DEST_PATH_IMAGE001
可分别表示企业的营收数据、支出数据及统计时间。
为了解决上述问题,本发明还提供一种大数据可视化分析装置,所述装置包括:
数据集接收模块,用于获取待可视化的数据集,所述数据集由三元组
Figure 576300DEST_PATH_IMAGE001
组成,其中,
Figure 226724DEST_PATH_IMAGE002
表示数据集中第
Figure 649353DEST_PATH_IMAGE003
个数据的数据生成时间,
Figure 18017DEST_PATH_IMAGE004
表示时间
Figure 787390DEST_PATH_IMAGE002
下第
Figure 292321DEST_PATH_IMAGE003
组数据的二维形式的数据值;
网格分辨率计算模块,用于构建与三元组形式对应的三维坐标系,并根据所述数据集在三维坐标系中构建初始可视化网格,每个初始可视化网格的分辨率为:
Figure 387316DEST_PATH_IMAGE005
Figure 977697DEST_PATH_IMAGE006
其中,
Figure 816340DEST_PATH_IMAGE007
表示时间
Figure 238094DEST_PATH_IMAGE002
下第
Figure 503991DEST_PATH_IMAGE003
组数据对应的初始可视化网格的分辨率,
Figure 86062DEST_PATH_IMAGE008
为预设的最大分辨率,
Figure 462817DEST_PATH_IMAGE009
表示第
Figure 676761DEST_PATH_IMAGE003
组所有二维形式数据所构成的函数关系,
Figure 113558DEST_PATH_IMAGE010
表示函数关系
Figure 678532DEST_PATH_IMAGE009
Figure 858978DEST_PATH_IMAGE011
求偏导后在
Figure 458586DEST_PATH_IMAGE012
的偏导值,
Figure 863023DEST_PATH_IMAGE010
表示函数关系
Figure 649713DEST_PATH_IMAGE009
Figure 132385DEST_PATH_IMAGE013
求偏导后在
Figure 586500DEST_PATH_IMAGE014
的偏导值,
Figure 365100DEST_PATH_IMAGE015
表示时间
Figure 639087DEST_PATH_IMAGE002
下生成的所有数据的总组数,
Figure 895756DEST_PATH_IMAGE016
表示时间
Figure 204377DEST_PATH_IMAGE002
下所有
Figure 153879DEST_PATH_IMAGE011
的数据总值,
Figure 180740DEST_PATH_IMAGE017
表示时间
Figure 37838DEST_PATH_IMAGE002
下所有
Figure 965080DEST_PATH_IMAGE013
的数据总值;
波动率计算模块,用于依次计算在三维坐标系中每组二维形式数据的波动率;
插值模块,用于根据波动率选择出需执行插值处理的数据组,得到待插值数据集;
可视化模块,用于对所述待插值数据集执行插值计算得到多组插值数据,提高与每组插值数据对应的初始可视化网格的分辨率,得到弱化可视化网格,将每组插值数据插入至对应的弱化可视化网格后,根据每个弱化可视化网格及初始可视化网格生成与待可视化的数据集对应的可视化热图,其中可视化热图的颜色强弱由弱化可视化网格及初始可视化网格的分辨率决定。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现上述所述的大数据可视化分析方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的大数据可视化分析方法。
本发明实施例为解决背景技术所述问题,获取待可视化的数据集,所述数据集由三元组
Figure 85483DEST_PATH_IMAGE001
组成,其中,
Figure 334062DEST_PATH_IMAGE002
表示数据集中第
Figure 932534DEST_PATH_IMAGE003
个数据的数据生成时间,
Figure 215747DEST_PATH_IMAGE004
表示时间
Figure 507051DEST_PATH_IMAGE002
下第
Figure 242926DEST_PATH_IMAGE003
组数据的二维形式的数据值,可见本发明实施例为规避传统直接根据数据生成可视化图表,将数据的组成形式改变为三元组形式,进一步地,构建与三元组形式对应的三维坐标系,并根据所述数据集在三维坐标系中构建初始可视化网格,且每个初始可视化网格的分辨率均根据
Figure 910668DEST_PATH_IMAGE004
的不同而设置出不同,因此可见后续生成的可视化图表明显在不同区域的像素也不同,规避了资源浪费,依次计算在三维坐标系中每组二维形式数据的波动率,根据波动率选择出需执行插值处理的数据组,得到待插值数据集,插值数据的作用是弥补部分数据缺失严重的问题,从而造成可视化效果不好的问题,但由于插值数据的真实性比不上实际数据,因此插值数据对应弱化可视化网格,根据每个弱化可视化网格及初始可视化网格生成与待可视化的数据集对应的可视化热图,其中可视化热图的颜色强弱由弱化可视化网格及初始可视化网格的分辨率决定,可见不同数据形式生成的颜色强弱不同,智能性更高。因此本发明提出的大数据可视化分析方法、装置、电子设备及计算机可读存储介质,可以提高可视化过程的智能性并规避资源浪费的问题。
附图说明
图1为本发明一实施例提供的大数据可视化分析方法的流程示意图;
图2为本发明一实施例提供的大数据可视化分析方法的可视化结果示意图;
图3为本发明一实施例提供的大数据可视化分析装置的功能模块图;
图4为本发明一实施例提供的实现所述大数据可视化分析方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种大数据可视化分析方法。所述大数据可视化分析方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述大数据可视化分析方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
参照图1所示,为本发明一实施例提供的大数据可视化分析方法的流程示意图。在本实施例中,所述大数据可视化分析方法包括:
S1、获取待可视化的数据集。
需解释的是,所述数据集由三元组
Figure 845126DEST_PATH_IMAGE001
组成,其中,
Figure 805866DEST_PATH_IMAGE002
表示数据集中第
Figure 29037DEST_PATH_IMAGE003
个数据的数据生成时间
Figure 500470DEST_PATH_IMAGE002
Figure 492697DEST_PATH_IMAGE004
表示时间
Figure 860224DEST_PATH_IMAGE002
下第
Figure 570691DEST_PATH_IMAGE003
组数据的二维形式的数据值。
示例性的,政府部门所管辖地区内共有50个国有企业,先获取在过去10年内每日的财务数据并可视化出热图从而直观感受出财务变化情况。因此需先获取每个国有企业的财务数据,但可想而知的是,实时获取每个国有企业每天的财务数据不切实际,因此按照每半个月为周期,获取得到50个国有企业在过去10年内每半个月的财务数据,因此
Figure 580235DEST_PATH_IMAGE002
可以为2021年1月1日、2021年1月15日、2021年2月1日等,假设
Figure 426969DEST_PATH_IMAGE002
为2021年1月1日时,则对应的共有50组财务数据(与国有企业数对应),其中第3组的财务数据可能为(120万,110万),120万为半个月为周期的营收数据, 110万为半个月为周期的支出数据。
S2、构建与三元组形式对应的三维坐标系,并根据所述数据集在三维坐标系中构建初始可视化网格。
可理解的是,三维坐标系的三个维度分别与三元组对应,包括时间坐标轴、X坐标轴及Y坐标轴。三维坐标系的作用是将待可视化的数据集投射至该坐标系中,并通过后续的插值法计算出插值数据,并将插值数据进一步插入至坐标系中,从而根据待可视化的数据集实现高精度的可视化。
详细地,所述根据所述数据集在三维坐标系中构建初始可视化网格,包括:
将所述数据集按照数据生成时间的先后顺序执行排列,得到具有时间顺序的数据集;
依次将具有时间顺序的数据集中每组二维形式的数据值投射到所述三维坐标系中;
以投射到三维坐标系的每个数据作为中心生成与其对应的初始可视化网格,其中每个初始可视化网格的分辨率与对应的数据具有关系。
示例性的,上述国企财务数据集包括国企A:
Figure 293294DEST_PATH_IMAGE044
、国企B:
Figure 921416DEST_PATH_IMAGE045
、国企A:
Figure 531389DEST_PATH_IMAGE046
、国企B:
Figure 232628DEST_PATH_IMAGE047
,则
Figure 473117DEST_PATH_IMAGE044
Figure 892597DEST_PATH_IMAGE045
在时间坐标轴属于同一坐标,故将
Figure 978364DEST_PATH_IMAGE048
Figure 65269DEST_PATH_IMAGE049
投射到三维坐标系中,同时围绕国企A在
Figure 476659DEST_PATH_IMAGE050
的财务数据
Figure 616391DEST_PATH_IMAGE048
生成一个初始可视化网格、围绕国企B的
Figure 771429DEST_PATH_IMAGE049
生成一个初始可视化网格,以此类推。
需理解的是,若统一生成具有相同分辨率的初始可视化网格的方法虽然可行,但本发明实施例认为并非是最优方法,因为后续会用计算插值数据以提高整个数据集可视化的精准度,而不同数据所用到的插值数据量不相同,若采用同样的分辨率,则容易造成计算资源浪费的问题,比如每半个月采集一次每个国企的财务数据,发现国企A过去10年内的财务数据非常稳定,而国企B过去10年内的财务数据波动大,因此明显的,国企A的财务数据并不一定需要做插值处理,而国企B由于波动大,则其做插值处理的必要性非常高,因此其每个可视化网格的分辨率应该更高。
因此详细地,每个初始可视化网格的分辨率为:
Figure 447261DEST_PATH_IMAGE051
Figure 29552DEST_PATH_IMAGE006
其中,
Figure 423624DEST_PATH_IMAGE007
表示时间
Figure 116774DEST_PATH_IMAGE002
下第
Figure 709429DEST_PATH_IMAGE003
组数据对应的初始可视化网格的分辨率,
Figure 197042DEST_PATH_IMAGE008
为预设的最大分辨率,
Figure 78410DEST_PATH_IMAGE009
表示第
Figure 73786DEST_PATH_IMAGE003
组所有二维形式数据所构成的函数关系,
Figure 724210DEST_PATH_IMAGE010
表示函数关系
Figure 382725DEST_PATH_IMAGE009
Figure 751389DEST_PATH_IMAGE011
求偏导后在
Figure 520762DEST_PATH_IMAGE012
的偏导值,
Figure 291272DEST_PATH_IMAGE010
表示函数关系
Figure 386267DEST_PATH_IMAGE009
Figure 976648DEST_PATH_IMAGE013
求偏导后在
Figure 313826DEST_PATH_IMAGE014
的偏导值,
Figure 735580DEST_PATH_IMAGE015
表示时间
Figure 1477DEST_PATH_IMAGE002
下生成的所有数据的总组数,
Figure 79154DEST_PATH_IMAGE016
表示时间
Figure 455909DEST_PATH_IMAGE002
下所有
Figure 935432DEST_PATH_IMAGE011
的数据总值,
Figure 372229DEST_PATH_IMAGE017
表示时间
Figure 937203DEST_PATH_IMAGE002
下所有
Figure 117648DEST_PATH_IMAGE013
的数据总值。
示例性的,如计算国企A在
Figure 956072DEST_PATH_IMAGE050
的财务数据
Figure 563771DEST_PATH_IMAGE048
的初始可视化网格的像素值,则计算在时间
Figure 616041DEST_PATH_IMAGE002
下共50组财务数据中所有营收数据和支出数据的总和,同时根据国企A在所有时间下的财务数据拟合出函数关系
Figure 334598DEST_PATH_IMAGE009
,并依次求解
Figure 523134DEST_PATH_IMAGE011
偏导和
Figure 301734DEST_PATH_IMAGE013
偏导的值,从而量化出对应的初始可视化网格的分辨率。
S3、依次计算在三维坐标系中每组二维形式数据的波动率。
详细地,所述依次计算在三维坐标系中每组二维形式数据的波动率,包括:
采用如下公式计算得到波动率:
Figure 841300DEST_PATH_IMAGE018
Figure 363548DEST_PATH_IMAGE019
Figure 468907DEST_PATH_IMAGE020
其中,
Figure 916944DEST_PATH_IMAGE021
表示第
Figure 943806DEST_PATH_IMAGE003
组所有二维形式数据的波动率,
Figure 738586DEST_PATH_IMAGE022
表示第
Figure 901715DEST_PATH_IMAGE003
组所有x形式数据的波动率,
Figure 287696DEST_PATH_IMAGE023
表示第
Figure 536275DEST_PATH_IMAGE003
组所有y形式数据的波动率,
Figure 197064DEST_PATH_IMAGE024
表示第
Figure 480277DEST_PATH_IMAGE003
组所有x形式数据的平均值,
Figure 771582DEST_PATH_IMAGE025
表示第
Figure 5992DEST_PATH_IMAGE003
组所有y形式数据的平均值,
Figure 673733DEST_PATH_IMAGE026
表示第
Figure 545874DEST_PATH_IMAGE003
组数据的数据总量。
S4、根据波动率选择出需执行插值处理的数据组,得到待插值数据集。
详细地,所述根据波动率选择出需执行插值处理的数据组,得到待插值数据集,包括:
接收设定的第一波动阈值和第二波动阈值,其中第二波动阈值大于第一波动阈值;
依次判断每组波动率与第一波动阈值和第二波动阈值的大小关系;
将波动率小于第一波动阈值的数据组设置成直接可视化数据集;
将波动率大于或等于第一波动阈值,但小于第二波动阈值的数据组设置成第一待插值数据集;
将波动率大于或等于第二波动阈值的数据组设置成第二待插值数据集,其中第一待插值数据集和第二待插值数据集统称为所述待插值数据集。
如上所述可知,当波动率小于第一波动阈值时,表示该组的数据稳定性高,因此通过已有数据即可反映出数据的总体趋势,如通过对国企A过去10年内每半个月所采集的财务数据计算得到的波动率为0.12,表示国企A的财务数据极其稳定,因此没有必要继续执行插值处理,而国企B的波动率可能为120,波动率特别大反映出国企B的财务不稳定性,因此需要在国企B每半个月内的财务数据内继续插入新的插值类财务数据,以提高对国企B的可视化精准度。
可理解的是,本发明实施例采用二阶段的插值处理方法,即将波动率大于或等于第一波动阈值但小于第二波动阈值的数据组采用第一种插值处理方法,将波动率大于或等于第二波动阈值的数据组采用第二种插值处理方法。
S5、对所述待插值数据集执行插值计算得到多组插值数据,提高与每组插值数据对应的初始可视化网格的分辨率,得到弱化可视化网格,将每组插值数据插入至对应的弱化可视化网格后,根据每个弱化可视化网格及初始可视化网格生成与待可视化的数据集对应的可视化热图,其中可视化热图的颜色强弱由弱化可视化网格及初始可视化网格的分辨率决定。
详细地,所述对所述待插值数据集执行插值计算得到多组插值数据,包括:
依次从所述第一待插值数据集中提取数据生成时间相邻的两组待插值数据;
根据下式计算得到相邻两组待插值数据的插值数据,其中插值数据为二维形式,包括
Figure 8080DEST_PATH_IMAGE011
值和
Figure 231251DEST_PATH_IMAGE013
值:
Figure 437104DEST_PATH_IMAGE027
其中,
Figure 429331DEST_PATH_IMAGE028
Figure 328017DEST_PATH_IMAGE029
表示第一待插值数据集中第
Figure 835221DEST_PATH_IMAGE030
组待插值数据和第
Figure 77722DEST_PATH_IMAGE031
组待插值数据在三维坐标系中的
Figure 190034DEST_PATH_IMAGE011
值,
Figure 994042DEST_PATH_IMAGE032
Figure 191805DEST_PATH_IMAGE033
表示第一待插值数据集中第
Figure 473882DEST_PATH_IMAGE030
组待插值数据和第
Figure 440701DEST_PATH_IMAGE031
组待插值数据在三维坐标系中的
Figure 681189DEST_PATH_IMAGE013
值,
Figure 100669DEST_PATH_IMAGE034
为设定的处于第
Figure 968130DEST_PATH_IMAGE030
组和第
Figure 789455DEST_PATH_IMAGE031
组之间的
Figure 200845DEST_PATH_IMAGE011
值,
Figure 107621DEST_PATH_IMAGE035
表示以
Figure 793817DEST_PATH_IMAGE036
为两组待插值数据的前提下
Figure 735228DEST_PATH_IMAGE034
对应的
Figure 317520DEST_PATH_IMAGE013
值;
对所述第二待插值数据集中每组待插值数据执行牛顿插值法,得到对应的插值数据。
示例性的,国企B的财务数据的波动率很大,按照时间划分包括
Figure 711592DEST_PATH_IMAGE049
Figure 404741DEST_PATH_IMAGE052
Figure 433615DEST_PATH_IMAGE053
等,经计算可知属于第一待插值数据集,因此构建出国企B财务数据的函数关系
Figure 921228DEST_PATH_IMAGE009
,此时可知
Figure 802596DEST_PATH_IMAGE003
为国企B的组号,并通过上述公式分别计算得到在
Figure 299437DEST_PATH_IMAGE049
Figure 949861DEST_PATH_IMAGE052
之间的插值数据,
Figure 608375DEST_PATH_IMAGE052
Figure 773778DEST_PATH_IMAGE053
之间的插值数据等。
此外,牛顿插值法为当前已公开的技术实施手段,在此不再赘述。
进一步地,所述提高与每组插值数据对应的初始可视化网格的分辨率,得到弱化可视化网格,包括:
根据初始可视化网格的分辨率计算方法,计算出插值数据的初始可视化网格的分辨率;
根据插值数据中
Figure 808730DEST_PATH_IMAGE011
值和
Figure 579240DEST_PATH_IMAGE013
值计算得到弱化率;
根据弱化率降低插值数据初始可视化网格的分辨率,得到所述弱化可视化网格。
示例性的,国企B财务数据
Figure 907190DEST_PATH_IMAGE049
Figure 763151DEST_PATH_IMAGE052
之间的插值数据假设为
Figure 601794DEST_PATH_IMAGE054
,则通过S2步骤的初始可视化网格的分辨率计算方法可计算得到与
Figure 961231DEST_PATH_IMAGE054
对应的分辨率。
但由于插值数据是通过真实数据计算和拟合得到,因此为了凸显出其插值数据与真实数据的差异性,插值数据的分辨率相比真实数据来说更低。详细地,所述根据插值数据中
Figure 961548DEST_PATH_IMAGE011
值和
Figure 39226DEST_PATH_IMAGE013
值计算得到偏差率,包括:
根据下式计算得到偏差率:
Figure 681560DEST_PATH_IMAGE037
其中,
Figure 161082DEST_PATH_IMAGE038
表示插值数据中的
Figure 394618DEST_PATH_IMAGE011
值,
Figure 458126DEST_PATH_IMAGE039
表示插值数据中的
Figure 638572DEST_PATH_IMAGE013
值,
Figure 707022DEST_PATH_IMAGE040
表示插值数据的偏差率。
进一步地,所述根据弱化率降低插值数据初始可视化网格的分辨率,得到所述弱化可视化网格,包括:
采用如下公式计算得到弱化可视化网格的分辨率
Figure 314721DEST_PATH_IMAGE041
其中,
Figure 366991DEST_PATH_IMAGE042
表示时间
Figure 85548DEST_PATH_IMAGE002
下第
Figure 539663DEST_PATH_IMAGE030
组插值数据对应的弱化可视化网格的分辨率,
Figure 115001DEST_PATH_IMAGE043
表示时间
Figure 654567DEST_PATH_IMAGE002
下第
Figure 681209DEST_PATH_IMAGE030
组插值数据对应的初始可视化网格的分辨率。
进一步地,参阅图2所示,本发明实施例根据每个可视化网格(可能为初始可视化网格,也可能为弱化可视化网格)的分辨率大小,通过Python或MATLAB等工具生成可视化热图,其中可视化热图的颜色强弱由弱化可视化网格及初始可视化网格的分辨率决定,即颜色越强表示其数据重要性越高,颜色越低表明其数据可能为插值数据或不重要的真实类数据。
本发明实施例为解决背景技术所述问题,获取待可视化的数据集,所述数据集由三元组
Figure 989831DEST_PATH_IMAGE001
组成,其中,
Figure 673753DEST_PATH_IMAGE002
表示数据集中第
Figure 435036DEST_PATH_IMAGE003
个数据的数据生成时间,
Figure 760975DEST_PATH_IMAGE004
表示时间
Figure 924103DEST_PATH_IMAGE002
下第
Figure 44506DEST_PATH_IMAGE003
组数据的二维形式的数据值,可见本发明实施例为规避传统直接根据数据生成可视化图表,将数据的组成形式改变为三元组形式,进一步地,构建与三元组形式对应的三维坐标系,并根据所述数据集在三维坐标系中构建初始可视化网格,且每个初始可视化网格的分辨率均根据
Figure 355401DEST_PATH_IMAGE004
的不同而设置出不同,因此可见后续生成的可视化图表明显在不同区域的像素也不同,规避了资源浪费,依次计算在三维坐标系中每组二维形式数据的波动率,根据波动率选择出需执行插值处理的数据组,得到待插值数据集,插值数据的作用是弥补部分数据缺失严重的问题,从而造成可视化效果不好的问题,但由于插值数据的真实性比不上实际数据,因此插值数据对应弱化可视化网格,根据每个弱化可视化网格及初始可视化网格生成与待可视化的数据集对应的可视化热图,其中可视化热图的颜色强弱由弱化可视化网格及初始可视化网格的分辨率决定,可见不同数据形式生成的颜色强弱不同,智能性更高。因此本发明提出的大数据可视化分析方法、装置、电子设备及计算机可读存储介质,可以提高可视化过程的智能性并规避资源浪费的问题。
如图3所示,是本发明一实施例提供的大数据可视化分析装置的功能模块图。
本发明所述大数据可视化分析装置100可以安装于电子设备中。根据实现的功能,所述大数据可视化分析装置100可以包括数据集接收模块101、网格分辨率计算模块102、波动率计算模块103、插值模块104及可视化模块105。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
所述数据集接收模块101,用于获取待可视化的数据集,所述数据集由三元组
Figure 219452DEST_PATH_IMAGE001
组成,其中,
Figure 735622DEST_PATH_IMAGE002
表示数据集中第
Figure 292505DEST_PATH_IMAGE003
个数据的数据生成时间,
Figure 28380DEST_PATH_IMAGE004
表示时间
Figure 696122DEST_PATH_IMAGE002
下第
Figure 771525DEST_PATH_IMAGE003
组数据的二维形式的数据值;
所述网格分辨率计算模块102,用于构建与三元组形式对应的三维坐标系,并根据所述数据集在三维坐标系中构建初始可视化网格,每个初始可视化网格的分辨率为:
Figure 499310DEST_PATH_IMAGE005
Figure 722481DEST_PATH_IMAGE006
其中,
Figure 426869DEST_PATH_IMAGE007
表示时间
Figure 419096DEST_PATH_IMAGE002
下第
Figure 114519DEST_PATH_IMAGE003
组数据对应的初始可视化网格的分辨率,
Figure 559407DEST_PATH_IMAGE008
为预设的最大分辨率,
Figure 568952DEST_PATH_IMAGE009
表示第
Figure 681264DEST_PATH_IMAGE003
组所有二维形式数据所构成的函数关系,
Figure 485272DEST_PATH_IMAGE010
表示函数关系
Figure 683035DEST_PATH_IMAGE009
Figure 230691DEST_PATH_IMAGE011
求偏导后在
Figure 696045DEST_PATH_IMAGE012
的偏导值,
Figure 670955DEST_PATH_IMAGE010
表示函数关系
Figure 90435DEST_PATH_IMAGE009
Figure 441782DEST_PATH_IMAGE013
求偏导后在
Figure 263107DEST_PATH_IMAGE014
的偏导值,
Figure 674497DEST_PATH_IMAGE015
表示时间
Figure 581273DEST_PATH_IMAGE002
下生成的所有数据的总组数,
Figure 470731DEST_PATH_IMAGE016
表示时间
Figure 208880DEST_PATH_IMAGE002
下所有
Figure 18268DEST_PATH_IMAGE011
的数据总值,
Figure 412340DEST_PATH_IMAGE017
表示时间
Figure 105490DEST_PATH_IMAGE002
下所有
Figure 901407DEST_PATH_IMAGE013
的数据总值;
所述波动率计算模块103,用于依次计算在三维坐标系中每组二维形式数据的波动率;
所述插值模块104,用于根据波动率选择出需执行插值处理的数据组,得到待插值数据集;
所述可视化模块105,用于对所述待插值数据集执行插值计算得到多组插值数据,提高与每组插值数据对应的初始可视化网格的分辨率,得到弱化可视化网格,将每组插值数据插入至对应的弱化可视化网格后,根据每个弱化可视化网格及初始可视化网格生成与待可视化的数据集对应的可视化热图,其中可视化热图的颜色强弱由弱化可视化网格及初始可视化网格的分辨率决定。
详细地,本发明实施例中所述大数据可视化分析装置100中的所述各模块在使用时采用与上述的图1中所述的基于区块链的产品供应链管理方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
如图4所示,是本发明一实施例提供的实现大数据可视化分析方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线12,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如大数据可视化分析方法程序。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card, SMC)、安全数字(SecureDigital, SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如大数据可视化分析方法程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如大数据可视化分析方法程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线12可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线12可以分为地址总线、数据总线、控制总线等。所述总线12被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图4仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图4示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的大数据可视化分析方法程序是多个指令的组合,在所述处理器10中运行时,可以实现:
获取待可视化的数据集,所述数据集由三元组
Figure 389021DEST_PATH_IMAGE001
组成,其中,
Figure 270389DEST_PATH_IMAGE002
表示数据集中第
Figure 501650DEST_PATH_IMAGE003
个数据的数据生成时间,
Figure 152074DEST_PATH_IMAGE004
表示时间
Figure 574703DEST_PATH_IMAGE002
下第
Figure 740105DEST_PATH_IMAGE003
组数据的二维形式的数据值;
构建与三元组形式对应的三维坐标系,并根据所述数据集在三维坐标系中构建初始可视化网格,每个初始可视化网格的分辨率为:
Figure 775057DEST_PATH_IMAGE005
Figure 279988DEST_PATH_IMAGE006
其中,
Figure 374983DEST_PATH_IMAGE007
表示时间
Figure 230944DEST_PATH_IMAGE002
下第
Figure 804007DEST_PATH_IMAGE003
组数据对应的初始可视化网格的分辨率,
Figure 163444DEST_PATH_IMAGE008
为预设的最大分辨率,
Figure 429341DEST_PATH_IMAGE009
表示第
Figure 5553DEST_PATH_IMAGE003
组所有二维形式数据所构成的函数关系,
Figure 647887DEST_PATH_IMAGE010
表示函数关系
Figure 127410DEST_PATH_IMAGE009
Figure 564208DEST_PATH_IMAGE011
求偏导后在
Figure 925919DEST_PATH_IMAGE012
的偏导值,
Figure 840785DEST_PATH_IMAGE010
表示函数关系
Figure 440394DEST_PATH_IMAGE009
Figure 48093DEST_PATH_IMAGE013
求偏导后在
Figure 100362DEST_PATH_IMAGE014
的偏导值,
Figure 51876DEST_PATH_IMAGE015
表示时间
Figure 505991DEST_PATH_IMAGE002
下生成的所有数据的总组数,
Figure 284591DEST_PATH_IMAGE016
表示时间
Figure 824157DEST_PATH_IMAGE002
下所有
Figure 346405DEST_PATH_IMAGE011
的数据总值,
Figure 451764DEST_PATH_IMAGE017
表示时间
Figure 401266DEST_PATH_IMAGE002
下所有
Figure 162548DEST_PATH_IMAGE013
的数据总值;
依次计算在三维坐标系中每组二维形式数据的波动率;
根据波动率选择出需执行插值处理的数据组,得到待插值数据集;
对所述待插值数据集执行插值计算得到多组插值数据,提高与每组插值数据对应的初始可视化网格的分辨率,得到弱化可视化网格,将每组插值数据插入至对应的弱化可视化网格后,根据每个弱化可视化网格及初始可视化网格生成与待可视化的数据集对应的可视化热图,其中可视化热图的颜色强弱由弱化可视化网格及初始可视化网格的分辨率决定。
具体地,所述处理器10对上述指令的具体实现方法可参考图1至图4对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取待可视化的数据集,所述数据集由三元组
Figure 488487DEST_PATH_IMAGE001
组成,其中,
Figure 156010DEST_PATH_IMAGE002
表示数据集中第
Figure 276413DEST_PATH_IMAGE003
个数据的数据生成时间,
Figure 524991DEST_PATH_IMAGE004
表示时间
Figure 389042DEST_PATH_IMAGE002
下第
Figure 406677DEST_PATH_IMAGE003
组数据的二维形式的数据值;
构建与三元组形式对应的三维坐标系,并根据所述数据集在三维坐标系中构建初始可视化网格,每个初始可视化网格的分辨率为:
Figure 760298DEST_PATH_IMAGE005
Figure 496172DEST_PATH_IMAGE006
其中,
Figure 898335DEST_PATH_IMAGE007
表示时间
Figure 36055DEST_PATH_IMAGE002
下第
Figure 262375DEST_PATH_IMAGE003
组数据对应的初始可视化网格的分辨率,
Figure 954387DEST_PATH_IMAGE008
为预设的最大分辨率,
Figure 425820DEST_PATH_IMAGE009
表示第
Figure 418047DEST_PATH_IMAGE003
组所有二维形式数据所构成的函数关系,
Figure 51154DEST_PATH_IMAGE010
表示函数关系
Figure 558358DEST_PATH_IMAGE009
Figure 567903DEST_PATH_IMAGE011
求偏导后在
Figure 414636DEST_PATH_IMAGE012
的偏导值,
Figure 484223DEST_PATH_IMAGE010
表示函数关系
Figure 914942DEST_PATH_IMAGE009
Figure 462598DEST_PATH_IMAGE013
求偏导后在
Figure 429417DEST_PATH_IMAGE014
的偏导值,
Figure 404326DEST_PATH_IMAGE015
表示时间
Figure 89386DEST_PATH_IMAGE002
下生成的所有数据的总组数,
Figure 440732DEST_PATH_IMAGE016
表示时间
Figure 262058DEST_PATH_IMAGE002
下所有
Figure 204606DEST_PATH_IMAGE011
的数据总值,
Figure 111382DEST_PATH_IMAGE017
表示时间
Figure 764955DEST_PATH_IMAGE002
下所有
Figure 440787DEST_PATH_IMAGE013
的数据总值;
依次计算在三维坐标系中每组二维形式数据的波动率;
根据波动率选择出需执行插值处理的数据组,得到待插值数据集;
对所述待插值数据集执行插值计算得到多组插值数据,提高与每组插值数据对应的初始可视化网格的分辨率,得到弱化可视化网格,将每组插值数据插入至对应的弱化可视化网格后,根据每个弱化可视化网格及初始可视化网格生成与待可视化的数据集对应的可视化热图,其中可视化热图的颜色强弱由弱化可视化网格及初始可视化网格的分辨率决定。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种大数据可视化分析方法,其特征在于,所述方法包括:
获取待可视化的数据集,所述数据集由三元组
Figure 357993DEST_PATH_IMAGE001
组成,其中,
Figure 752066DEST_PATH_IMAGE002
表示数据集中第
Figure 445215DEST_PATH_IMAGE003
个数据的数据生成时间,
Figure 241133DEST_PATH_IMAGE004
表示时间
Figure 994325DEST_PATH_IMAGE002
下第
Figure 610114DEST_PATH_IMAGE003
组数据的二维形式的数据值;
构建与三元组形式对应的三维坐标系,并根据所述数据集在三维坐标系中构建初始可视化网格,每个初始可视化网格的分辨率为:
Figure 106955DEST_PATH_IMAGE005
Figure 261774DEST_PATH_IMAGE006
其中,
Figure 185867DEST_PATH_IMAGE007
表示时间
Figure 554532DEST_PATH_IMAGE002
下第
Figure 386221DEST_PATH_IMAGE003
组数据对应的初始可视化网格的分辨率,
Figure 891152DEST_PATH_IMAGE008
为预设的最大分辨率,
Figure 986147DEST_PATH_IMAGE009
表示第
Figure 779791DEST_PATH_IMAGE003
组所有二维形式数据所构成的函数关系,
Figure 415171DEST_PATH_IMAGE010
表示函数关系
Figure 40188DEST_PATH_IMAGE009
Figure 804619DEST_PATH_IMAGE011
求偏导后在
Figure 882297DEST_PATH_IMAGE012
的偏导值,
Figure 259051DEST_PATH_IMAGE010
表示函数关系
Figure 738574DEST_PATH_IMAGE009
Figure 909793DEST_PATH_IMAGE013
求偏导后在
Figure 474766DEST_PATH_IMAGE014
的偏导值,
Figure 655212DEST_PATH_IMAGE015
表示时间
Figure 254820DEST_PATH_IMAGE002
下生成的所有数据的总组数,
Figure 361054DEST_PATH_IMAGE016
表示时间
Figure 147745DEST_PATH_IMAGE002
下所有
Figure 131881DEST_PATH_IMAGE011
的数据总值,
Figure 585996DEST_PATH_IMAGE017
表示时间
Figure 364596DEST_PATH_IMAGE002
下所有
Figure 435321DEST_PATH_IMAGE013
的数据总值;
依次计算在三维坐标系中每组二维形式数据的波动率;
根据波动率选择出需执行插值处理的数据组,得到待插值数据集;
对所述待插值数据集执行插值计算得到多组插值数据,提高与每组插值数据对应的初始可视化网格的分辨率,得到弱化可视化网格,将每组插值数据插入至对应的弱化可视化网格后,根据每个弱化可视化网格及初始可视化网格生成与待可视化的数据集对应的可视化热图,其中可视化热图的颜色强弱由弱化可视化网格及初始可视化网格的分辨率决定。
2.如权利要求1所述的大数据可视化分析方法,其特征在于,所述根据所述数据集在三维坐标系中构建初始可视化网格,包括:
将所述数据集按照数据生成时间的先后顺序执行排列,得到具有时间顺序的数据集;
依次将具有时间顺序的数据集中每组二维形式的数据值投射到所述三维坐标系中;
以投射到三维坐标系的每个数据作为中心生成与其对应的初始可视化网格。
3.如权利要求1所述的大数据可视化分析方法,其特征在于,所述依次计算在三维坐标系中每组二维形式数据的波动率,包括:
采用如下公式计算得到波动率:
Figure 957569DEST_PATH_IMAGE018
Figure 266190DEST_PATH_IMAGE019
Figure 215692DEST_PATH_IMAGE020
其中,
Figure 741089DEST_PATH_IMAGE021
表示第
Figure 801449DEST_PATH_IMAGE003
组所有二维形式数据的波动率,
Figure 964577DEST_PATH_IMAGE022
表示第
Figure 350559DEST_PATH_IMAGE003
组所有x形式数据的波动率,
Figure 333558DEST_PATH_IMAGE023
表示第
Figure 197609DEST_PATH_IMAGE003
组所有y形式数据的波动率,
Figure 480823DEST_PATH_IMAGE024
表示第
Figure 772127DEST_PATH_IMAGE003
组所有x形式数据的平均值,
Figure 678DEST_PATH_IMAGE025
表示第
Figure 668419DEST_PATH_IMAGE003
组所有y形式数据的平均值,
Figure 806140DEST_PATH_IMAGE026
表示第
Figure 268345DEST_PATH_IMAGE003
组数据的数据总量。
4.如权利要求1所述的大数据可视化分析方法,其特征在于,所述根据波动率选择出需执行插值处理的数据组,得到待插值数据集,包括:
接收设定的第一波动阈值和第二波动阈值,其中第二波动阈值大于第一波动阈值;
依次判断每组波动率与第一波动阈值和第二波动阈值的大小关系;
将波动率小于第一波动阈值的数据组设置成直接可视化数据集;
将波动率大于或等于第一波动阈值,但小于第二波动阈值的数据组设置成第一待插值数据集;
将波动率大于或等于第二波动阈值的数据组设置成第二待插值数据集,其中第一待插值数据集和第二待插值数据集统称为所述待插值数据集。
5.如权利要求4所述的大数据可视化分析方法,其特征在于,所述对所述待插值数据集执行插值计算得到多组插值数据,包括:
依次从所述第一待插值数据集中提取数据生成时间相邻的两组待插值数据;
根据下式计算得到相邻两组待插值数据的插值数据,其中插值数据为二维形式,包括
Figure 491516DEST_PATH_IMAGE011
值和
Figure 962949DEST_PATH_IMAGE013
值:
Figure 955175DEST_PATH_IMAGE027
其中,
Figure 588282DEST_PATH_IMAGE028
Figure 797284DEST_PATH_IMAGE029
表示第一待插值数据集中第
Figure 806828DEST_PATH_IMAGE030
组待插值数据和第
Figure 450299DEST_PATH_IMAGE031
组待插值数据在三维坐标系中的
Figure 723149DEST_PATH_IMAGE011
值,
Figure 452071DEST_PATH_IMAGE032
Figure 265306DEST_PATH_IMAGE033
表示第一待插值数据集中第
Figure 966546DEST_PATH_IMAGE030
组待插值数据和第
Figure 207034DEST_PATH_IMAGE031
组待插值数据在三维坐标系中的
Figure 626514DEST_PATH_IMAGE013
值,
Figure 476396DEST_PATH_IMAGE034
为设定的处于第
Figure 32142DEST_PATH_IMAGE030
组和第
Figure 443532DEST_PATH_IMAGE031
组之间的
Figure 350308DEST_PATH_IMAGE011
值,
Figure 505346DEST_PATH_IMAGE035
表示以
Figure 181178DEST_PATH_IMAGE036
为两组待插值数据的前提下
Figure 29048DEST_PATH_IMAGE034
对应的
Figure 423121DEST_PATH_IMAGE013
值;
对所述第二待插值数据集中每组待插值数据执行牛顿插值法,得到对应的插值数据。
6.如权利要求5所述的大数据可视化分析方法,其特征在于,所述提高与每组插值数据对应的初始可视化网格的分辨率,得到弱化可视化网格,包括:
根据初始可视化网格的分辨率计算方法,计算出插值数据的初始可视化网格的分辨率;
根据插值数据中
Figure 349226DEST_PATH_IMAGE011
值和
Figure 145144DEST_PATH_IMAGE013
值计算得到弱化率;
根据弱化率降低插值数据初始可视化网格的分辨率,得到所述弱化可视化网格。
7.如权利要求6所述的大数据可视化分析方法,其特征在于,所述根据插值数据中
Figure 632757DEST_PATH_IMAGE011
值和
Figure 514125DEST_PATH_IMAGE013
值计算得到偏差率,包括:
根据下式计算得到偏差率:
Figure 10966DEST_PATH_IMAGE037
其中,
Figure 661390DEST_PATH_IMAGE038
表示插值数据中的
Figure 585483DEST_PATH_IMAGE011
值,
Figure 485306DEST_PATH_IMAGE039
表示插值数据中的
Figure 520258DEST_PATH_IMAGE013
值,
Figure 795163DEST_PATH_IMAGE040
表示插值数据的偏差率。
8.如权利要求7所述的大数据可视化分析方法,其特征在于,所述根据弱化率降低插值数据初始可视化网格的分辨率,得到所述弱化可视化网格,包括:
采用如下公式计算得到弱化可视化网格的分辨率
Figure 890158DEST_PATH_IMAGE041
其中,
Figure 480539DEST_PATH_IMAGE042
表示时间
Figure 319182DEST_PATH_IMAGE002
下第
Figure 944199DEST_PATH_IMAGE030
组插值数据对应的弱化可视化网格的分辨率,
Figure 210095DEST_PATH_IMAGE043
表示时间
Figure 287772DEST_PATH_IMAGE002
下第
Figure 398948DEST_PATH_IMAGE030
组插值数据对应的初始可视化网格的分辨率。
9.如权利要求8所述的大数据可视化分析方法,其特征在于,所述待可视化的数据集的三元组
Figure 377006DEST_PATH_IMAGE001
可分别表示企业的营收数据、支出数据及统计时间。
10.一种大数据可视化分析装置,其特征在于,所述装置包括:
数据集接收模块,用于获取待可视化的数据集,所述数据集由三元组
Figure 813803DEST_PATH_IMAGE001
组成,其中,
Figure 378777DEST_PATH_IMAGE002
表示数据集中第
Figure 355960DEST_PATH_IMAGE003
个数据的数据生成时间,
Figure 689990DEST_PATH_IMAGE004
表示时间
Figure 297688DEST_PATH_IMAGE002
下第
Figure 349958DEST_PATH_IMAGE003
组数据的二维形式的数据值;
网格分辨率计算模块,用于构建与三元组形式对应的三维坐标系,并根据所述数据集在三维坐标系中构建初始可视化网格,每个初始可视化网格的分辨率为:
Figure 334095DEST_PATH_IMAGE005
Figure 257051DEST_PATH_IMAGE006
其中,
Figure 534186DEST_PATH_IMAGE007
表示时间
Figure 73752DEST_PATH_IMAGE002
下第
Figure 596000DEST_PATH_IMAGE003
组数据对应的初始可视化网格的分辨率,
Figure 904622DEST_PATH_IMAGE008
为预设的最大分辨率,
Figure 650861DEST_PATH_IMAGE009
表示第
Figure 677723DEST_PATH_IMAGE003
组所有二维形式数据所构成的函数关系,
Figure 738083DEST_PATH_IMAGE010
表示函数关系
Figure 901211DEST_PATH_IMAGE009
Figure 287193DEST_PATH_IMAGE011
求偏导后在
Figure 34307DEST_PATH_IMAGE012
的偏导值,
Figure 632778DEST_PATH_IMAGE010
表示函数关系
Figure 915992DEST_PATH_IMAGE009
Figure 207296DEST_PATH_IMAGE013
求偏导后在
Figure 943171DEST_PATH_IMAGE014
的偏导值,
Figure 610913DEST_PATH_IMAGE015
表示时间
Figure 545371DEST_PATH_IMAGE002
下生成的所有数据的总组数,
Figure 7576DEST_PATH_IMAGE016
表示时间
Figure 230747DEST_PATH_IMAGE002
下所有
Figure 952714DEST_PATH_IMAGE011
的数据总值,
Figure 944941DEST_PATH_IMAGE017
表示时间
Figure 578047DEST_PATH_IMAGE002
下所有
Figure 288514DEST_PATH_IMAGE013
的数据总值;
波动率计算模块,用于依次计算在三维坐标系中每组二维形式数据的波动率;
插值模块,用于根据波动率选择出需执行插值处理的数据组,得到待插值数据集;
可视化模块,用于对所述待插值数据集执行插值计算得到多组插值数据,提高与每组插值数据对应的初始可视化网格的分辨率,得到弱化可视化网格,将每组插值数据插入至对应的弱化可视化网格后,根据每个弱化可视化网格及初始可视化网格生成与待可视化的数据集对应的可视化热图,其中可视化热图的颜色强弱由弱化可视化网格及初始可视化网格的分辨率决定。
CN202211194432.1A 2022-09-29 2022-09-29 大数据可视化分析方法及装置 Active CN115269945B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211194432.1A CN115269945B (zh) 2022-09-29 2022-09-29 大数据可视化分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211194432.1A CN115269945B (zh) 2022-09-29 2022-09-29 大数据可视化分析方法及装置

Publications (2)

Publication Number Publication Date
CN115269945A true CN115269945A (zh) 2022-11-01
CN115269945B CN115269945B (zh) 2022-12-20

Family

ID=83757282

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211194432.1A Active CN115269945B (zh) 2022-09-29 2022-09-29 大数据可视化分析方法及装置

Country Status (1)

Country Link
CN (1) CN115269945B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2837949A1 (fr) * 2002-03-29 2003-10-03 Emg Procede pour la visualisation d'une image geographique semi-reelle
CN102945570A (zh) * 2012-11-23 2013-02-27 华东师范大学 一种全空间三维数字地球模型的构建方法
CN109947879A (zh) * 2019-01-29 2019-06-28 中国海洋大学 一种基于复杂网络的海洋观测大数据可视化分析方法
CN113593006A (zh) * 2021-06-15 2021-11-02 广州观必达数据技术有限责任公司 一种基于深度学习的气象数据空间插值精细化方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2837949A1 (fr) * 2002-03-29 2003-10-03 Emg Procede pour la visualisation d'une image geographique semi-reelle
CN102945570A (zh) * 2012-11-23 2013-02-27 华东师范大学 一种全空间三维数字地球模型的构建方法
CN109947879A (zh) * 2019-01-29 2019-06-28 中国海洋大学 一种基于复杂网络的海洋观测大数据可视化分析方法
CN113593006A (zh) * 2021-06-15 2021-11-02 广州观必达数据技术有限责任公司 一种基于深度学习的气象数据空间插值精细化方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郑景云等: "北半球千年尺度气候高分辨率数据集研制及可靠性研究", 《中国基础科学》 *

Also Published As

Publication number Publication date
CN115269945B (zh) 2022-12-20

Similar Documents

Publication Publication Date Title
CN112052370A (zh) 报文生成方法、装置、电子设备及计算机可读存储介质
CN111428458A (zh) 通用报表生成方法、装置及计算机可读存储介质
CN112347214A (zh) 目标区域划分方法、装置、电子设备及存储介质
CN112446544A (zh) 交通流预测模型训练方法、装置、电子设备及存储介质
CN113032403B (zh) 数据洞察方法、装置、电子设备及存储介质
CN112883042A (zh) 数据更新及展示方法、装置、电子设备及存储介质
CN112949443A (zh) 表格结构识别方法、装置、电子设备及存储介质
CN113946690A (zh) 潜在客户挖掘方法、装置、电子设备及存储介质
CN113504935A (zh) 软件开发质量评估方法、装置、电子设备及可读存储介质
CN113327136A (zh) 归因分析方法、装置、电子设备及存储介质
CN114881616A (zh) 业务流程执行方法、装置、电子设备及存储介质
CN112579621A (zh) 数据展示方法、装置、电子设备及计算机存储介质
CN111932147A (zh) 指标统筹的可视化方法、装置、电子设备及存储介质
CN115269945B (zh) 大数据可视化分析方法及装置
CN111950707A (zh) 基于行为共现网络的行为预测方法、装置、设备及介质
WO2019232916A1 (zh) 项目控制方法、装置、电子设备及介质
CN112561500B (zh) 基于用户数据的薪酬数据生成方法、装置、设备及介质
CN114417998A (zh) 数据特征映射方法、装置、设备及存储介质
CN115238179A (zh) 项目推送方法、装置、电子设备及计算机可读存储介质
CN114385844A (zh) 可视化图像处理的方法及终端设备
CN113434820B (zh) 图表y轴坐标优化方法、装置、设备及存储介质
CN115796710B (zh) 电力物资智能抽检方法、装置、电子设备及可读存储介质
CN114841608A (zh) 维度数据调整方法、装置、设备及存储介质
CN113064928A (zh) 报表数据查询方法、装置、电子设备及存储介质
CN114840602A (zh) 数据可视化方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 705, Floor 7, Building 3, Yard 8, Automobile Museum West Road, Fengtai District, Beijing 100071

Patentee after: Beijing Changhe Digital Intelligence Technology Co.,Ltd.

Country or region after: China

Patentee after: Changhe Information Co.,Ltd.

Address before: 705, Floor 7, Building 3, Yard 8, Automobile Museum West Road, Fengtai District, Beijing 100071

Patentee before: Beijing Changhe Digital Intelligence Technology Co.,Ltd.

Country or region before: China

Patentee before: Shanxi Changhe Technology Co.,Ltd.