CN111339138A - 一种数据可视化方法、装置以及计算机可读存储介质 - Google Patents

一种数据可视化方法、装置以及计算机可读存储介质 Download PDF

Info

Publication number
CN111339138A
CN111339138A CN202010104892.5A CN202010104892A CN111339138A CN 111339138 A CN111339138 A CN 111339138A CN 202010104892 A CN202010104892 A CN 202010104892A CN 111339138 A CN111339138 A CN 111339138A
Authority
CN
China
Prior art keywords
component
data
data processing
downstream
upstream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010104892.5A
Other languages
English (en)
Other versions
CN111339138B (zh
Inventor
胡继城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010104892.5A priority Critical patent/CN111339138B/zh
Publication of CN111339138A publication Critical patent/CN111339138A/zh
Application granted granted Critical
Publication of CN111339138B publication Critical patent/CN111339138B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种数据可视化方法、装置以及计算机可读存储介质,该方法可应用于数据计算的场景中,该方法包括:获取下游组件针对数据流的第一数据处理结果,获取下游组件的上游组件针对数据流的第二数据处理结果;根据第一数据处理结果和第二数据处理结果,获取下游组件针对数据流的数据处理评估参数;在可视化界面创建下游组件与上游组件之间的数据吞吐链;数据吞吐链包括上游组件与下游组件之间的数据处理流向关系、上游组件的组件信息以及下游组件的组件信息;在可视化界面中的数据吞吐链所在位置处,输出数据处理评估参数。采用本申请,可增强对组件针对数据流的数据处理情况的监控力度。

Description

一种数据可视化方法、装置以及计算机可读存储介质
技术领域
本申请涉及数据处理的技术领域,尤其涉及一种数据可视化方法、装置以及计算机可读存储介质。
背景技术
随着计算机网络的不断发展,越来越多的事物可以通过计算机网络得以实现,因此,随着时间的推移,计算机网络中所产生的数据也就越来越多。在这大量的数据中,往往很难找到所需要的有效信息,例如,某数据增长规律,某产品受众人群特征等信息。因此,需要对这大量的数据进行数据处理才能推导出所需的有效信息,数据处理的手段可以包括数据过滤、数据组合以及数据变形等手段。其中,可以通过组件(例如分布式流式计算框架storm中的处理组件bolt)对数据(可以是数据流)进行处理。
现有技术中,在通过组件对数据进行处理时,通常只能查看到每个组件的输入数据和输出数据,进而通过该输入数据和输出数据来实现对组件的数据处理情况的监控,但是,仅仅通过组件的输入数据和输出数据实现对组件的数据处理情况的监控,此间监控的力度较低。
申请内容
本申请提供了一种数据可视化方法、装置以及计算机可读存储介质,可增强对组件针对数据流的数据处理情况的监控力度。
本申请一方面提供了一种数据可视化方法,包括:
获取下游组件针对数据流的第一数据处理结果,获取下游组件的上游组件针对数据流的第二数据处理结果;
根据第一数据处理结果和第二数据处理结果,获取下游组件针对数据流的数据处理评估参数;
在可视化界面创建下游组件与上游组件之间的数据吞吐链;数据吞吐链包括上游组件与下游组件之间的数据处理流向关系、上游组件的组件信息以及下游组件的组件信息;
在可视化界面中的数据吞吐链所在位置处,输出数据处理评估参数。
其中,第二数据处理结果为空;
根据第一数据处理结果和第二数据处理结果,获取下游组件针对数据流的数据处理评估参数,包括:
从第一数据处理结果中,获取下游组件针对数据流的数据处理失败量;
将数据处理失败量,确定为数据处理评估参数。
其中,还包括:
当数据处理失败量大于数据处理失败量阈值时,根据数据处理失败量和下游组件的组件信息,生成第一告警消息;
将第一告警消息发送至告警设备。
其中,第二数据处理结果中包括上游组件的出口数据的数据量;出口数据属于数据流;出口数据为上游组件向下游组件所发送的数据;
根据第一数据处理结果和第二数据处理结果,获取下游组件针对数据流的数据处理评估参数,包括:
从第一数据处理结果中获取下游组件针对出口数据的数据处理量;
根据数据处理量与出口数据的数据量,确定下游组件针对出口数据的数据成功处理率;
将数据成功处理率确定为数据处理评估参数。
其中,还包括:
当数据成功处理率小于数据成功处理率阈值时,根据数据成功处理率、下游组件的组件信息和上游组件的组件信息,生成第二告警消息;
将第二告警消息发送至告警设备。
其中,上游组件的组件信息包括上游组件的组件标识信息;下游组件的组件信息包括下游组件的组件标识信息;
在可视化界面创建下游组件与上游组件之间的数据吞吐链,包括:
根据上游组件的组件标识信息和下游组件的组件标识信息,创建上游组件与下游组件之间的数据流向路径;数据流向路径为上游组件指向下游组件的路径;
将数据流向路径添加至路径数组中;路径数组中包括多个元素,一个元素对应于一条数据流向路径;
根据路径数组,在可视化界面中创建下游组件与上游组件之间的数据吞吐链;路径数组中的一条数据流向路径对应于一条数据吞吐链。
其中,还包括:
获取数据处理评估参数对应的数据处理评估指标;
当数据处理评估参数的参数值未达到数据处理评价指标的指标值时,将数据吞吐链在可视化界面中进行突出显示。
其中,获取下游组件针对数据流的第一数据处理结果,获取下游组件的上游组件针对数据流的第二数据处理结果,包括:
根据上游组件的组件标识信息,从哈希表中获取上游组件对应的组件上下游关系信息和上游组件的第二数据处理结果;
在组件上下游关系信息中,获取下游组件的组件标识信息,根据下游组件的组件标识信息获取下游组件对应的结果映射关系信息;
在结果映射关系信息中获取下游组件对应的第一数据处理结果。
其中,还包括:
从数据库中获取下游组件的组件详情信息;组件详情信息中包括下游组件的组件标识信息和下游组件的上游组件的组件标识信息;
根据上游组件的组件标识信息和下游组件的组件标识信息,生成下游组件与上游组件之间的组件上下游关系信息;
从组件详情信息中获取下游组件对应的第一数据处理结果,根据第一数据处理结果和下游组件的组件标识信息生成结果映射关系信息;
将组件上下游关系信息和结果映射关系信息,添加至哈希表中。
本申请一方面提供了一种数据可视化装置,包括:
结果获取模块,用于获取下游组件针对数据流的第一数据处理结果,获取下游组件的上游组件针对数据流的第二数据处理结果;
参数获取模块,用于根据第一数据处理结果和第二数据处理结果,获取下游组件针对数据流的数据处理评估参数;
创建模块,用于在可视化界面创建下游组件与上游组件之间的数据吞吐链;数据吞吐链包括上游组件与下游组件之间的数据处理流向关系、上游组件的组件信息以及下游组件的组件信息;
输出模块,用于在可视化界面中的数据吞吐链所在位置处,输出数据处理评估参数。
其中,第二数据处理结果为空;
参数获取模块,包括:
第一获取单元,用于从第一数据处理结果中,获取下游组件针对数据流的数据处理失败量;
第一确定单元,用于将数据处理失败量,确定为数据处理评估参数。
其中,数据可视化装置,还包括:
第一消息生成模块,用于当数据处理失败量大于数据处理失败量阈值时,根据数据处理失败量和下游组件的组件信息,生成第一告警消息;
第一消息发送模块,用于将第一告警消息发送至告警设备。
其中,第二数据处理结果中包括上游组件的出口数据的数据量;出口数据属于数据流;出口数据为上游组件向下游组件所发送的数据;
参数获取模块,包括:
第二获取单元,用于从第一数据处理结果中获取下游组件针对出口数据的数据处理量;
第二确定单元,用于根据数据处理量与出口数据的数据量,确定下游组件针对出口数据的数据成功处理率;
第三确定单元,用于将数据成功处理率确定为数据处理评估参数。
其中,数据可视化装置,还包括:
第二消息生成模块,用于当数据成功处理率小于数据成功处理率阈值时,根据数据成功处理率、下游组件的组件信息和上游组件的组件信息,生成第二告警消息;
第二消息发送模块,用于将第二告警消息发送至告警设备。
其中,上游组件的组件信息包括上游组件的组件标识信息;下游组件的组件信息包括下游组件的组件标识信息;
创建模块,包括:
路径创建单元,用于根据上游组件的组件标识信息和下游组件的组件标识信息,创建上游组件与下游组件之间的数据流向路径;数据流向路径为上游组件指向下游组件的路径;
路径添加单元,用于将数据流向路径添加至路径数组中;路径数组中包括多个元素,一个元素对应于一条数据流向路径;
吞吐链创建单元,用于根据路径数组,在可视化界面中创建下游组件与上游组件之间的数据吞吐链;路径数组中的一条数据流向路径对应于一条数据吞吐链。
其中,数据可视化装置,还包括:
指标获取模块,用于获取数据处理评估参数对应的数据处理评估指标;
突出显示模块,用于当数据处理评估参数的参数值未达到数据处理评价指标的指标值时,将数据吞吐链在可视化界面中进行突出显示。
其中,结果获取模块,包括:
关系获取单元,用于根据上游组件的组件标识信息,从哈希表中获取上游组件对应的组件上下游关系信息和上游组件的第二数据处理结果;
第一结果获取单元,用于在组件上下游关系信息中,获取下游组件的组件标识信息,根据下游组件的组件标识信息获取下游组件对应的结果映射关系信息;
第二结果获取单元,用于在结果映射关系信息中获取下游组件对应的第一数据处理结果。
其中,数据可视化装置,还包括:
详情获取模块,用于从数据库中获取下游组件的组件详情信息;组件详情信息中包括下游组件的组件标识信息和下游组件的上游组件的组件标识信息;
第一关系生成模块,用于根据上游组件的组件标识信息和下游组件的组件标识信息,生成下游组件与上游组件之间的组件上下游关系信息;
第二关系生成模块,用于从组件详情信息中获取下游组件对应的第一数据处理结果,根据第一数据处理结果和下游组件的组件标识信息生成结果映射关系信息;
添加模块,用于将组件上下游关系信息和结果映射关系信息,添加至哈希表中。
本申请一方面提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行如本申请中一方面中的方法。
本申请一方面提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令当被处理器执行时使该处理器执行上述一方面中的方法。
本申请首先可以获取下游组件针对数据流的第一数据处理结果,获取下游组件的上游组件针对数据流的第二数据处理结果;根据第一数据处理结果和第二数据处理结果,获取下游组件针对数据流的数据处理评估参数;在可视化界面创建下游组件与上游组件之间的数据吞吐链;数据吞吐链包括上游组件与下游组件之间的数据处理流向关系、上游组件的组件信息以及下游组件的组件信息;在可视化界面中的数据吞吐链所在位置处,输出数据处理评估参数。由此可见,本申请提出的方法可以通过具有数据处理流向关系的数据吞吐链,来展示下游组件对应的数据处理评估参数,使得通过该数据吞吐链可以实现对下游组件针对数据流的数据处理情况的直观监控,增强了对下游组件针对数据流的数据处理情况的监控力度。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的一种系统架构示意图;
图2是本申请提供的一种数据可视化的场景示意图;
图3是本申请提供的一种数据可视化方法的流程示意图;
图4是本申请提供的一种获取路径数组的场景示意图;
图5是本申请提供的另一种数据可视化的场景示意图;
图6是本申请提供的另一种数据可视化的场景示意图;
图7是本申请提供的一种数据可视化装置的结构示意图;
图8是本申请提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
大数据(Big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临,大数据也吸引了越来越多的关注,大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。本申请可以应用在针对大数据(可以是流数据stream)处理过程中的数据处理情况的监控场景中。
请参见图1,是本申请提供的一种系统架构示意图。如图1所示,该系统架构示意图包括服务器100以及多个终端设备,多个终端设备具体包括终端设备200a、终端设备200b和终端设备200c。其中,终端设备200a、终端设备200b和终端设备200c均能通过网络与服务器100之间相互通信,终端设备可以是手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internet device,MID)、可穿戴设备(例如智能手表、智能手环等)。此处以终端设备200a与服务器100之间的通信为例进行说明。
请参见图2,是本申请提供的一种数据可视化的场景示意图。如图2所示,组件结构100a中包括用于对数据流进行处理的各个组件。其中,对数据流进行数据处理可以指对数据流中的各个数据进行筛选、过滤、组合以及补充字段等数据处理,也可以指其他数据处理,对此不作限制。组件结构100a中具体包括源头组件、处理组件A、处理组件B、处理组件C、处理组件D和处理组件E。其中,源头组件用于获取需要进行处理的数据流,处理组件(包括处理组件A、处理组件B、处理组件C、处理组件D和处理组件E)用于对源头组件所提供的数据流进行数据处理。
此处对组件结构100a进行具体说明:首先,源头组件会将获取到的数据流给到处理组件A和处理组件B,可以将处理组件A和处理组件B称之为源头组件的上游组件,将源头组件称之为处理组件A和处理组件B的上游组件。具体的,源头组件可以将获取到的数据流分成两个部分,分别为数据流A和数据流B,进而将数据流A给到处理组件A,将数据流B给到处理组件B。接着,处理组件A可以对所获取到的数据流A进行处理,得到处理之后的数据流A。同理,处理组件A可以将所得到的处理之后的数据流A分为两个部分,该两个部分为数据流C和数据流D。处理组件A可以将数据流C给到处理组件C,将数据流D给到处理组件D。可以将处理组件A称之为处理组件C和处理组件D的上游组件,将处理组件C和处理组件D均称之为处理组件A的下游组件。处理组件C可以对所获取到的数据流C进行数据处理,得到数据处理结果,并输出该数据处理结果;处理组件D可以对所获取到的数据流D进行数据处理,得到数据处理结果,并输出该数据处理结果。同理,处理组件B可以对数据流B进行数据处理,得到处理后的数据流B,此处,处理后的数据流B即是数据流E。处理组件B可以将数据流E传输到处理组件E,处理组件E可以对所获取到的数据流E进行数据处理,得到数据处理结果,并输出该数据处理结果。其中,上述处理组件C、处理组件D和处理组件E所输出的数据处理结果即是对源头组件所获取到的最原始的数据流进行处理之后的最终结果。
如图2所示,可视化处理结果101a是通过对上述组件结构100a中的各个组件的数据处理结果进行评估之后所获得的。其中,上述组件结构100a中的各个组件针对数据流的组件详情信息(若组件为处理组件,则包括该处理组件对应的数据处理结果)可以存储于服务器100中,终端设备200a可以向服务器100拉取组件结构中的各个组件针对数据流的数据处理详情。终端设备200a可以根据向服务器100拉取得到的各个组件的组件详情信息,计算得到组件结构100a中的各个处理组件(包括处理组件A、处理组件B、处理组件C、处理组件D和处理组件E)的数据处理评估参数(具体计算过程可以参见下述图3中的步骤S101-步骤S103),该数据处理评估参数表征了处理组件针对其所对应的数据流的数据处理效果。其中,源头组件没有数据处理评估参数。如图2所示,该数据处理评估参数可以包括处理组件针对数据流的处理率、失败量以及平均处理时耗。具体的,处理组件A的数据处理评估参数为针对数据流A的数据处理评估参数100b“处理率a1,失败量a2,平均处理时耗a3”;处理组件B的数据处理评估参数为针对数据流B的数据处理评估参数101b“处理率b1,失败量b2,平均处理时耗b3”;处理组件C的数据处理评估参数为数据处理评估参数102b“处理率c1,失败量c2,平均处理时耗c3”;处理组件D的数据处理评估参数为针对数据流D的数据处理评估参数103b“处理率d1,失败量d2,平均处理时耗d3”;处理组件E的数据处理评估参数为针对数据流E的数据处理评估参数104b“处理率e1,失败量e2,平均处理时耗e3”。
终端设备200a可以通过计算得到的各个处理组件对应的数据处理评估参数生成上述可视化处理结果101a(生成可视化处理结果101a的具体过程可以参见下述图3中的步骤S103-步骤S104),终端设备200a可以在终端页面中显示该可视化处理结果101a,如图2所示,可视化处理结果101a中在对应位置处还显示有各个处理组件的数据处理评估参数。
通过本申请所提供的方法,可以对各个处理组件针对对应的数据流的数据处理效果进行直观展示,并且对数据流堵塞(例如,当某个处理组件针对数据流的处理率小于某个阈值,则认为该处理组件发生了数据流堵塞)可以实时感知,同时对发生数据流堵塞的点(即组件位置,也就是发生数据流堵塞的处理组件的位置)可以快速定位,增强了针对数据流的数据处理过程的监控能力。
请参见图3,是本申请提供的一种数据可视化方法的流程示意图,如图3所示,方法可以包括:
步骤S101,获取下游组件针对数据流的第一数据处理结果,获取下游组件的上游组件针对数据流的第二数据处理结果;
具体的,本实施例中的执行主体可以是任何能够进行数据处理的设备或者云空间,此处以执行主体为前端设备为例进行说明,该前端设备可以是数据监控人员(监控针对数据流的处理情况的人员)所持有的设备。此处,需要对处理数据流(stream)的各个组件进行说明:对数据流进行数据处理的组件可以包括分布式流失计算框架(Storm)中的源头组件(Spout)和处理组件(Bolt),其中,源头组件用于获取需要进行数据处理的数据流,该数据流中可以包括多条数据,处理组件则是用于对源头组件获取到的数据流进行数据处理的组件。因此,可以理解的是,每个处理组件所处理的数据流均来自(或者说均属于)于源头组件所获取到的数据流。
上述下游组件可以是任意一个处理组件,上游组件可以是源头组件或者是处理组件。该下游组件与上游组件是相对的,举个例子,若组件Z1是从组件Z2处获取进行处理的数据流,而组件Z1又是向组件Z3提供数据流的组件,则组件Z2可以称之为组件Z1的上游组件,组件Z1可以称之为组件Z2的下游组件,组件z1也可以称之为组件Z3的上游组件,组件Z3也可以称之为组件Z1的下游组件。因此,下述中上游组件与下游组件指任意两个相邻的组件,举个例子,若是组件Z4和组件Z5是相邻的两个组件,组件Z4向组件Z5提供需要处理的数据流,则可以将组件Z4称之为上游组件,将组件Z5称之为下游组件。每个组件所处理的数据流均来自于其上游组件。
其中,前端设备可以在数据库(可以存储于服务器中的数据库)中获取下游组件的组件详情信息,该组件详情信息中可以包括下游组件的组件标识信息(该组件标识信息可以为该下游组件的组件名称)、该下游组件的上游组件的组件标识信息、失败量(即该下游组件对数据流中处理失败的数据的数据量)、处理量(即下游组件对数据流中处理成功的数据的数据量)、处理时耗(即下游组件处理数据流所用的时间)、发送量(即下游组件发送给其下游组件的数据流所包含的数据的数据量)、该下游组件与上游组件之间的数据流的流标识信息(可以是其间的数据流的名称,每相邻两个组件之间对应都有一个数据流)以及组件类型信息(该组件类型信息是为了区分该下游组件是源头组件还是处理组件)。
通过上述下游组件的组件详情信息,前端设备可以构造该下游组件的3个哈希。第1个哈希为:可以从下游组件的组件详情信息中获取下游组件的组件标识信息、该下游组件的上游组件的组件标识信息以及上游组件与下游组件之间的数据流的流标识信息。可以根据所获取到的下游组件的组件标识信息、上游组件的组件标识信息以及上游组件与下游组件之间的数据流的流标识信息,建立组件上下游关系信息,该组件上下游关系信息的形式可以是:上游组件的组件标识信息→流标识信息→下游组件的组件标识信息。可以将该组件上下游关系信息存储到哈希表中,得到上述下游组件的第1个哈希。第2个哈希为:可以从下游组件的组件详情信息中获取处理量、失败量、处理时耗以及组件类型信息作为该下游组件的第一数据处理结果。可以根据下游组件的组件标识信息、该第一数据处理结果以及下游组件与其上游组件之间的数据流的流标识信息生成结果映射关系信息,该结果映射关系信息的形式可以是:下游组件的组件标识信息→流标识信息→第一数据处理结果。可以将该结果映射关系信息存储至哈希表中,得到该下游组件的第2个哈希。第3个哈希为:可以从上述下游组件的组件详情信息中获取发送量,将该发送量作为该下游组件的第二数据处理结果,由于每个下游组件都可以作为其下游组件的上游组件,因此,上述上游组件的第二数据处理结果同样也是该上游组件的组件详情信息中的发送量。前端设备可以根据上述下游组件的第二数据处理结果、下游组件的组件标识信息以及下游组件与其上游组件之间的数据流的流标识信息,构建出口数据映射关系信息,该出口数据映射关系信息的形式可以是:下游组件的组件标识信息→流标识信息→第二数据处理结果。可以将该出口数据映射关系信息添加至哈希表进行存储,得到上述下游组件的第3个哈希。其中,某个下游组件的组件详情信息中的发送量为该下游组件的出口数据的数据量,某个组件的出口数据是指该组件向其下游组件所发送的数据。
可以理解的是,每个处理组件均对应在哈希表中有上述同类型的3个哈希。处理组件还可以从数据库中获取源头组件的组件详情信息,源头组件在哈希表中可以有上述第3个哈希,该第3个哈希中包括源头组件的组件详情信息中的发送量,该发送量也就是源头组件所获取到的需要进行数据处理的数据流的总数据量,换句话说,该发送量为源头组件向其下游组件发送的数据流的总数据量。
其中,需要进行说明的是,上述数据库可以是存储于服务器中的,数据库中所存储的各个组件的组件详情信息可以是服务器根据相关字段定期从网络中所采集到的数据,服务器获取各个组件的组件详情信息可以是通过分布式流式计算框架storm的rest api(一种网络接口)接口所获取到的。组件详情信息中还可以包括对应的组件的流数据的上报时间,前端设备可以根据各个组件详情信息中的组件的流数据的上报时间获取在所需要进行数据处理的时间段内的流数据。更详细的,组件详情信息中可以包括多个字段,该多个字段分别为拓扑名称(字段类型可以是varchar)、拓扑标识(即拓扑ID,字段类型可以是varchar)、集群标识(即集群ID,字段类型可以是int)、组件标识(即组件详情信息所属的组件的组件标识信息,该组件标识信息可以是组件名称,字段类型可以是varchar)、上游组件标识(即组件详情信息所属的组件的上游组件的组件标识信息,字段类型可以是varchar)、流标识(即组件详情信息所属的组件与其上游组件之间的流数据的流标识信息,字段类型可以是varchar)、发送量(字段类型可以是bigint)、总发送量(字段类型可以是bigint)、处理量(字段类型可以是bigint)、同步量(字段类型可以是bigint)、失败量(字段类型可以是bigint)、处理时耗(字段类型可以是char)、组件类型(字段类型可以是char)、吞吐类型(字段类型可以是char)、上报时间(字段类型可以是bigint)以及上报日期(字段类型可以是int)。
可以将上述哈希表理解为是一个字典,可以通过该字典检索到各个组件的第一数据处理结果、第二数据处理结果以及各个组件的上游组件是谁(也可以描述为可以检索到各个组件的下游组件是谁)。可以通过该哈希表来创建组件与组件之间的数据吞吐链,具体过程请参见下述:
由于源头组件是提供数据流的组件,因此,首先从源头组件开始,将源头组件作为上游组件,并在哈希表中查找源头组件的下游组件。查找的方式为:可以根据源头组件的组件标识信息,在哈希表中查找以源头组件的组件标识信息作为上游组件的组件标识信息的组件上下游关系信息,并从查找到的组件上下游关系信息中获取源头组件的下游组件的组件标识信息。因此,下述上游组件指源头组件,下述下游组件指源头组件的下游组件。
可以根据获取到的下游组件的组件标识信息在哈希表中获取包含该下游组件的组件标识信息的结果映射关系信息,并从该结果映射关系信息中获取下游组件的第一数据处理结果。可以根据上游组件的组件标识信息在哈希表中获取包含该上游组件的组件标识信息的出口数据映射关系信息,可以从该出口数据映射关系信息中获取上游组件的第二数据处理结果。
步骤S102,根据第一数据处理结果和第二数据处理结果,获取下游组件针对数据流的数据处理评估参数;
具体的,前端设备可以根据上述获取到的下游组件(源头组件的下游组件)的第一数据处理结果和上游组件(源头组件)的第二数据处理结果,获取下游组件针对数据流(源头组件所获取到的需要进行数据处理的数据流)的数据处理评估参数。其中,若数据处理评估参数仅包括数据处理失败量,则此时上游组件的第二数据处理结果可以为空,前端设备可以从下游组件的第一数据处理结果中获取失败量作为数据处理失败量,并将该数据处理失败量作为下游组件的数据处理评估参数。若数据处理评估参数包括数据处理失败量和数据成功处理率,则可以以上述的方式得到数据处理失败量。接着,可以从第二数据处理结果中获取上游组件的发送量,可以从第一数据处理结果中获取下游组件的处理量,可以将所获取到的处理量与发送量之间的比值,作为下游组件的数据成功处理率。其中,数据处理评估参数还可以包括平均处理时耗,该平均处理时耗的获取方式可以是,可以从下游组件的第一数据处理结果中获取处理时耗和处理量,可以将该处理时耗与处理量之间的比值作为下游组件的平均处理时耗。数据处理评估参数具体包括哪些参数可以根据实际应用场景决定,对此不作限制。
其中,当上述计算出的下游组件的数据处理评估参数中的数据处理失败量大于某个数据量阈值(可以自行设定,可以将该数据量阈值称之为数据处理失败量阈值),则可以根据数据处理失败量和下游组件的组件信息,生成第一告警消息。例如,当数据处理失败量为300条,超过了数据处理失败量阈值200条,下游组件的组件标识信息为z1,则第一告警消息可以是“处理组件z1的数据失败量达到了300条,请注意”。前端设备可以将所生成的第一告警消息发送至告警设备,告警设备可以是设备维护人员或者开发人员的手机设备。
同样,当数据处理评估参数中的下游组件的数据成功处理率小于数据成功处理率阈值(可以自行设定)时,可以根据该数据成功处理率、下游组件的组件标识信息以及上游组件的组件标识信息,生成第二告警消息。例如,当数据成功处理率为10%,小于数据成功处理率阈值30%,下游组件的组件标识信息为z2,上游组件的组件标识信息为z3,则所生成的第二告警消息可以是“请注意,组件z2针对组件z3所提供的数据流中的数据的数据成功处理率仅为10%”。前端设备可以将所生成的第二告警消息发送也发送至上述告警设备,以实时提醒相关工作人员尽快排查问题和解决问题(例如,通过对下游组件的组件配置进行优化等操作来解决数据处理成功率低的问题)。
步骤S103,在可视化界面创建下游组件与上游组件之间的数据吞吐链;数据吞吐链包括上游组件与下游组件之间的数据处理流向关系、上游组件的组件信息以及下游组件的组件信息;
具体的,上游组件的组件信息可以为上游组件的组件标识信息,下游组件的组件信息可以为下游组件的组件标识信息。可以根据下游组件(此处指源头组件的下游组件)的组件标识信息、上游组件(此处指源头组件)的组件标识和下游组件的数据处理评估参数,创建下游组件和上游组件之间的数据流向路径,该数据流向路径具有数据处理流向关系,由于是上游组件为其下游组件提供下游组件需要进行数据处理的数据流,因此,该数据处理流向关系是指该数据流向路径是由上游组件指向(流向)下游组件的路径关系。因此,可以理解的是,一个数据流向路径中包括上游组件的组件标识信息、下游组件的组件标识信息以及下游组件的数据处理评估参数,例如,一个数据流向路径可以表示为:(上游组件的组件标识信息,下游组件的组件标识信息,下游组件的数据处理评估参数)。可以将所创建的数据流向路径添加到路径数组中,到此,即完成将源头组件与其下游组件之间的数据流向路径添加至了路径数组中。可以将路径数组中的一条数据流向路径称之为路径数组中的一个元素,路径数组中可以包括多个元素,即多条数据流向路径。任意两个相邻的组件之间均具有一条数据流向路径,即任意两个相互为下游组件和上游组件的组件之间具备一条数据流向路径。可以将源头组件作为起点,依次向下检索每个组件的下游组件,直到检索到某个组件不具有其下游组件,则表明已经将所有的数据流向路径添加至了路径数组中。将所有数据流向路径添加至路径数组中的原理可以参见下述:
需要进行说明的是,任意一个组件必然是某些组件的上游组件或者下游组件,还可以同时是某些组件的上游组件,也是另一些组件的下游组件,即组件与组件之间是相互连接的。因此接着,可以将源头组件的下游组件作为此时的上游组件,可以再根据该上游组件的组件标识信息在哈希表中获取查找到该上游组件的下游组件(查找的原理与查找源头组件的下游组件的原理相同,也是根据对应的组件上下游关系信息查找),并根据与创建源头组件与其下游组件之间的数据流向路径相同的原理,创建此时的上游组件(源头组件的下游组件)与其下游组件(源头组件的下游组件的下游组件)之间的数据流向路径。按照上述的过程依次查找当前的下游组件的下游组件,并每个将当前的下游组件与其下游组件之间的数据流向路径添加至路径数组中,直到当前的下游组件没有其下游组件,就可以停止查找,此时,即已经完成了将所有数据流向路径添加至了路径数组中。其中,可以构造一个回调函数(rev)来快速实现上述查找每个组件的下游组件,并创建每两个相邻的组件之间的数据流向路径的过程。同理,该回调函数的函数逻辑可以是:该回调函数的输入参数为(源头组件的组件标识信息,哈希表),因此,可以从输入的源头组件开始,此时当前的上游组件就是源头组件,利用所输入的哈希表查找到源头组件的下游组件,构建源头组件与其下游组件之间的数据流向路径,并将该数据流向路径添加至路径数组中。接着,当前的上游组件就为源头组件的下游组件,判断当前的上游组件是否有其下游组件(可以通过所输入的哈希表中的组件上下游关系信息进行判断),若是有,则回调上述回调函数,在创建当前的上游组件与其下游组件之间的数据流向路径,并将该数据流向路径添加至路径数组中。若是判断出当前的上游组件没有其下游组件,此时,得到的路径数组就是最终的路径数组,此时的路径数组中已经包含了所有的数据流向路径。
请参见图4,是本申请提供的一种获取路径数组的场景示意图。如图4所示,首先,步骤①,可以通过哈希表100f获取源头组件的下游组件,此处获取到源头组件的两个下游组件,分别为组件z1和组件z2。接着,可以创建源头组件与组件z1之间的数据流向路径t1,并创建源头组件与组件z2之间的数据流向路径t2,可以将所创建的数据流向路径t1和数据流向路径t2添加到路径数组k中。接着,步骤②,判断出组件z1具有下游组件,并且通过哈希表100f检索到组件z1的下游组件为组件z3。可以创建组件z1与组件z3之间的数据流向路径t3,可以将所创建的数据流向路径t3添加至路径数组k中。步骤③,判断出组件z2也具有下游组件,并且通过哈希表100f检索到组件z2的下游组件为组件z4。可以创建组件z2与组件z4之间的数据流向路径t4,可以将所创建的数据流向路径t4添加至路径数组k中。对上述步骤②和步骤③的执行顺序不作限制。接着,判断出组件z3和组件z4均没有下游组件了,因此,此时得到的路径数组就已经包含了所有的数据流向路径了,换句话说,此时的路径数组也就是最终得到的路径数组。
接着,可以通过上述所得到的数据流向路径,在可视化界面中创建组件与组件之间的数据吞吐链,路径数组中的一条数据流向路径就对应有一条数据吞吐链,同样,该数据吞吐链是上游组件指向下游组件的数据吞吐链。该数据吞吐链可以理解为是具有方向(相邻两个组件之中的上游组件指向下游组件的方向)的连接线,例如上述图2中的可视化处理结果101a中的源头组件与处理组件A之间的连接线、源头组件与处理组件B之间的连接线、处理组件A与处理组件C之间的连接线、处理组件A与处理组件D之间的连接线以及处理组件B与处理组件E之间的连接线均可以称之为数据吞吐链,每条数据吞吐链的两端即为分别对应的上游组件的组件标识信息和下游组件的组件标识信息。
步骤S104,在可视化界面中的数据吞吐链所在位置处,输出数据处理评估参数;
具体的,在可视化界面(即前端设备的显示界面)中创建了没相邻两个组件之间的数据吞吐链之后,同时,可以通过上述路径数组,分别在每条数据吞吐链所在位置处(可以是在数据吞吐链上方,或者在靠近数据吞吐链旁边,例如距离数据吞吐链10个像素的位置),输出每条数据吞吐链中的下游组件对应的数据处理评估参数。例如,在上述图2中,在源头组件与处理组件A之间的数据吞吐链所在位置处就显示有处理组件A的数据处理评估参数。可选的,上述所创建的数据吞吐链也可以直接包含对应的数据处理评估参数,因此,在可视化界面中创建完成各条数据吞吐链的同时,所创建的每条数据吞吐链的位置处就可以直接显示其所对应的数据处理评估参数。通过上述的方式即实现了通过所生成的路径数组,快速创建组件与组件之间数据吞吐链,并在数据吞吐链所在位置处显示其对应的数据处理评估参数。因此,使得开发人员可以快速查看到组件与组件之间的连接关系,以及各个组件针对其所对应的数据流的数据处理效果,当某个组件针对其所对应的数据流的数据处理效果不理想时,可以实现组件的快速定位并快速解决数据处理效果不理想所包含的问题。
更多的,前端设备还可以获取数据处理评估参数的数据处理评估指标,例如,当数据处理评估参数包括数据处理失败量时,数据处理评估指标可以包括数据处理失败量阈值;当数据处理评估参数包括数据处理失败量、数据成功处理率以及平均处理时耗时,数据处理评估指标可以包括数据处理失败量阈值、数据成功处理率阈值以及平均处理时耗阈值。当某条数据吞吐链对应的数据处理评估参数的参数值(即数据处理评估参数的数值)没有达到数据处理评估指标的指标值(即数据处理评估指标的数值)时,可以将该条数据吞吐链在可视化界面中进行突出显示。其中,数据处理评估参数的参数值没有达到数据处理评估指标的指标值的情况可以包括:数据处理失败量大于数据处理失败量阈值的情况、数据成功处理率小于数据成功处理率阈值的情况以及平均处理时耗大于平均处理时耗阈值的情况。将数据吞吐链进行突出显示的方式可以是:将数据吞吐链进行闪烁显示(闪烁频率可以自行设置)、将数据吞吐链进行突出颜色显示、将数据吞吐链进行加粗显示等方式。
请参见图5,是本申请提供的另一种数据可视化的场景示意图。如图5所示,数据流向路径的统一形式可以是数据流向路径100e的形式,数据流向路径100e中依次包含了上游组件的组件标识信息、下游组件的组件标识信息以及数据处理评估参数(下游组件的数据处理评估参数)。因此,如图5所示,路径数组中可以包括数据流向路径101e、数据流向路径102e、数据流向路径103e以及数据流向路径104e。由数据流向路径101e可以知道,源头组件的下游组件包括处理组件Z1,处理组件Z1的上游组件为源头组件,处理组件Z1的数据处理评估参数为数据处理评估参数P1。由数据流向路径102e可以知道,源头组件的下游组件还包括处理组件Z2,处理组件Z2的上游组件为源头组件,处理组件Z2的数据处理评估参数为数据处理评估参数P2。由数据流向路径103e可以知道,处理组件Z1的下游组件为处理组件Z3,处理组件Z3的上游组件为处理组件Z1,处理组件Z3的数据处理评估参数为数据处理评估参数P3。由数据流向路径104e可以知道,处理组件Z2的下游组件为处理组件Z4,处理组件Z4的上游组件为处理组件Z2,处理组件Z4的数据处理评估参数为数据处理评估参数P4。
因此,如图5所示,可以通过上述路径数组在可视化界面105e中创建组件与组件之间的数据吞吐链。其中,源头组件与处理组件Z1之间的数据吞吐链106e是通过数据流向路径101e所创建的;源头组件与处理组件Z2之间的数据吞吐链107e是通过数据流向路径102e所创建的;处理组件Z1与处理组件Z3之间的数据吞吐链108e是通过数据流向路径103e所创建的;处理组件Z2与处理组件Z4之间的数据吞吐链109e是通过数据流向路径104e所创建的。
请参见图6,是本申请提供的另一种数据可视化的场景示意图。其中,可以将数据处理评估参数通过表格的形式一行行地进行显示,图6中的前端设备105e中所显示的表格即是将图5中的各个组件的数据处理评估参数以表格的形式进行显示的。每相邻的两个组件之间具有一个数据处理评估参数,该数据处理评估参数为该相邻两个组件中处于下游组件位置的组件的数据处理评估参数。如图6所示,源头组件与处理组件Z1之间具有处理组件Z1的数据处理评估参数P1(此处为“处理率x1,失败量y1,平均处理时耗s1”);源头组件与处理组件Z2之间具有处理组件Z2的数据处理评估参数P2(此处为“处理率x2,失败量y2,平均处理时耗s2”);处理组件Z1与处理组件Z3之间具有处理组件Z3的数据处理评估参数P3(此处为“处理率x3,失败量y3,平均处理时耗s3”);处理组件Z2与处理组件Z4之间具有处理组件Z4的数据处理评估参数P4(此处为“处理率x4,失败量y4,平均处理时耗s4”)。
本申请首先可以获取下游组件针对数据流的第一数据处理结果,获取下游组件的上游组件针对数据流的第二数据处理结果;根据第一数据处理结果和第二数据处理结果,获取下游组件针对数据流的数据处理评估参数;在可视化界面创建下游组件与上游组件之间的数据吞吐链;数据吞吐链包括上游组件与下游组件之间的数据处理流向关系、上游组件的组件信息以及下游组件的组件信息;在可视化界面中的数据吞吐链所在位置处,输出数据处理评估参数。由此可见,本申请提出的方法可以通过具有数据处理流向关系的数据吞吐链,来展示下游组件对应的数据处理评估参数,实现了在下游组件对数据进行处理的过程中,可以对下游组件针对数据的处理情况进行直观监控。
请参见图7,是本申请提供的一种数据可视化装置的结构示意图。如图7所示,该数据可视化装置1可以包括:结果获取模块101、参数获取模块102、创建模块103和输出模块104;
结果获取模块101,用于获取下游组件针对数据流的第一数据处理结果,获取下游组件的上游组件针对数据流的第二数据处理结果;
参数获取模块102,用于根据第一数据处理结果和第二数据处理结果,获取下游组件针对数据流的数据处理评估参数;
创建模块103,用于在可视化界面创建下游组件与上游组件之间的数据吞吐链;数据吞吐链包括上游组件与下游组件之间的数据处理流向关系、上游组件的组件信息以及下游组件的组件信息;
输出模块104,用于在可视化界面中的数据吞吐链所在位置处,输出数据处理评估参数。
其中,结果获取模块101、参数获取模块102、创建模块103和输出模块104的具体功能实现方式请参见图3对应的实施例中的步骤S101-步骤S104,这里不再进行赘述。
其中,第二数据处理结果为空;
参数获取模块102,包括:第一获取单元1021和第一确定单元1022;
第一获取单元1021,用于从第一数据处理结果中,获取下游组件针对数据流的数据处理失败量;
第一确定单元1022,用于将数据处理失败量,确定为数据处理评估参数。
其中,第一获取单元1021和第一确定单元1022的具体功能实现方式请参见图3对应的实施例中的步骤S102,这里不再进行赘述。
其中,数据可视化装置1,还包括:第一消息生成模块105和第一消息发送模块106;
第一消息生成模块105,用于当数据处理失败量大于数据处理失败量阈值时,根据数据处理失败量和下游组件的组件信息,生成第一告警消息;
第一消息发送模块106,用于将第一告警消息发送至告警设备。
其中,第一消息生成模块105和第一消息发送模块106的具体功能实现方式请参见图3对应的实施例中的步骤S104,这里不再进行赘述。
其中,第二数据处理结果中包括上游组件的出口数据的数据量;出口数据属于数据流;出口数据为上游组件向下游组件所发送的数据;
参数获取模块102,包括:第二获取单元1023、第二确定单元1024和第三确定单元1025;
第二获取单元1023,用于从第一数据处理结果中获取下游组件针对出口数据的数据处理量;
第二确定单元1024,用于根据数据处理量与出口数据的数据量,确定下游组件针对出口数据的数据成功处理率;
第三确定单元1025,用于将数据成功处理率确定为数据处理评估参数。
其中,第二获取单元1023、第二确定单元1024和第三确定单元1025的具体功能实现方式请参见图3对应的实施例中的步骤S102,这里不再进行赘述。
其中,数据可视化装置1,还包括:第二消息生成模块107和第二消息发送模块108;
第二消息生成模块107,用于当数据成功处理率小于数据成功处理率阈值时,根据数据成功处理率、下游组件的组件信息和上游组件的组件信息,生成第二告警消息;
第二消息发送模块108,用于将第二告警消息发送至告警设备。
其中,第二消息生成模块107和第二消息发送模块108的具体功能实现方式请参见图3对应的实施例中的步骤S104,这里不再进行赘述。
其中,上游组件的组件信息包括上游组件的组件标识信息;下游组件的组件信息包括下游组件的组件标识信息;
创建模块103,包括:路径创建单元1031、路径添加单元1032和吞吐链创建单元1033;
路径创建单元1031,用于根据上游组件的组件标识信息和下游组件的组件标识信息,创建上游组件与下游组件之间的数据流向路径;数据流向路径为上游组件指向下游组件的路径;
路径添加单元1032,用于将数据流向路径添加至路径数组中;路径数组中包括多个元素,一个元素对应于一条数据流向路径;
吞吐链创建单元1033,用于根据路径数组,在可视化界面中创建下游组件与上游组件之间的数据吞吐链;路径数组中的一条数据流向路径对应于一条数据吞吐链。
其中,路径创建单元1031、路径添加单元1032和吞吐链创建单元1033的具体功能实现方式请参见图3对应的实施例中的步骤S103,这里不再进行赘述。
其中,数据可视化装置1,还包括:指标获取模块109和突出显示模块110;
指标获取模块109,用于获取数据处理评估参数对应的数据处理评估指标;
突出显示模块110,用于当数据处理评估参数的参数值未达到数据处理评价指标的指标值时,将数据吞吐链在可视化界面中进行突出显示。
其中,指标获取模块109和突出显示模块110的具体功能实现方式请参见图3对应的实施例中的步骤S104,这里不再进行赘述。
其中,结果获取模块101,包括:关系获取单元1011、第一结果获取单元1012和第二结果获取单元1013;
关系获取单元1011,用于根据上游组件的组件标识信息,从哈希表中获取上游组件对应的组件上下游关系信息和上游组件的第二数据处理结果;
第一结果获取单元1012,用于在组件上下游关系信息中,获取下游组件的组件标识信息,根据下游组件的组件标识信息获取下游组件对应的结果映射关系信息;
第二结果获取单元1013,用于在结果映射关系信息中获取下游组件对应的第一数据处理结果。
其中,关系获取单元1011、第一结果获取单元1012和第二结果获取单元1013的具体功能实现方式请参见图3对应的实施例中的步骤S101,这里不再进行赘述。
其中,数据可视化装置1,还包括:详情获取模块111、第一关系生成模块112、第二关系生成模块113和添加模块114;
详情获取模块111,用于从数据库中获取下游组件的组件详情信息;组件详情信息中包括下游组件的组件标识信息和下游组件的上游组件的组件标识信息;
第一关系生成模块112,用于根据上游组件的组件标识信息和下游组件的组件标识信息,生成下游组件与上游组件之间的组件上下游关系信息;
第二关系生成模块113,用于从组件详情信息中获取下游组件对应的第一数据处理结果,根据第一数据处理结果和下游组件的组件标识信息生成结果映射关系信息;
添加模块114,用于将组件上下游关系信息和结果映射关系信息,添加至哈希表中。
其中,详情获取模块111、第一关系生成模块112、第二关系生成模块113和添加模块114的具体功能实现方式请参见图3对应的实施例中的步骤S101,这里不再进行赘述。
本申请首先可以获取下游组件针对数据流的第一数据处理结果,获取下游组件的上游组件针对数据流的第二数据处理结果;根据第一数据处理结果和第二数据处理结果,获取下游组件针对数据流的数据处理评估参数;在可视化界面创建下游组件与上游组件之间的数据吞吐链;数据吞吐链包括上游组件与下游组件之间的数据处理流向关系、上游组件的组件信息以及下游组件的组件信息;在可视化界面中的数据吞吐链所在位置处,输出数据处理评估参数。由此可见,本申请提出的方法可以通过具有数据处理流向关系的数据吞吐链,来展示下游组件对应的数据处理评估参数,实现了在下游组件对数据进行处理的过程中,可以对下游组件针对数据的处理情况进行直观监控。
请参见图8,是本申请提供的一种计算机设备的结构示意图。如图8所示,计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,计算机设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图8所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图8所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现前文图3所对应实施例中对数据可视化方法的描述。应当理解,本申请中所描述的计算机设备1000也可执行前文图7所对应实施例中对数据可视化装置1的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请还提供了一种计算机可读存储介质,且计算机可读存储介质中存储有前文提及的数据可视化装置1所执行的计算机程序,且计算机程序包括程序指令,当处理器执行程序指令时,能够执行前文图3所对应实施例中对数据可视化方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,上述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖范围。

Claims (15)

1.一种数据可视化方法,其特征在于,包括:
获取下游组件针对数据流的第一数据处理结果,获取所述下游组件的上游组件针对所述数据流的第二数据处理结果;
根据所述第一数据处理结果和所述第二数据处理结果,获取所述下游组件针对所述数据流的数据处理评估参数;
在可视化界面创建所述下游组件与所述上游组件之间的数据吞吐链;所述数据吞吐链包括所述上游组件与所述下游组件之间的数据处理流向关系、所述上游组件的组件信息以及所述下游组件的组件信息;
在所述可视化界面中的所述数据吞吐链所在位置处,输出所述数据处理评估参数。
2.根据权利要求1所述的方法,其特征在于,所述第二数据处理结果为空;
所述根据所述第一数据处理结果和所述第二数据处理结果,获取所述下游组件针对所述数据流的数据处理评估参数,包括:
从所述第一数据处理结果中,获取所述下游组件针对所述数据流的数据处理失败量;
将所述数据处理失败量,确定为所述数据处理评估参数。
3.根据权利要求2所述的方法,其特征在于,还包括:
当所述数据处理失败量大于数据处理失败量阈值时,根据所述数据处理失败量和所述下游组件的组件信息,生成第一告警消息;
将所述第一告警消息发送至告警设备。
4.根据权利要求1所述的方法,其特征在于,所述第二数据处理结果中包括所述上游组件的出口数据的数据量;所述出口数据属于所述数据流;所述出口数据为所述上游组件向所述下游组件所发送的数据;
所述根据所述第一数据处理结果和所述第二数据处理结果,获取所述下游组件针对所述数据流的数据处理评估参数,包括:
从所述第一数据处理结果中获取所述下游组件针对所述出口数据的数据处理量;
根据所述数据处理量与所述出口数据的数据量,确定所述下游组件针对所述出口数据的数据成功处理率;
将所述数据成功处理率确定为所述数据处理评估参数。
5.根据权利要求4所述的方法,其特征在于,还包括:
当所述数据成功处理率小于数据成功处理率阈值时,根据所述数据成功处理率、所述下游组件的组件信息和所述上游组件的组件信息,生成第二告警消息;
将所述第二告警消息发送至告警设备。
6.根据权利要求1所述的方法,其特征在于,所述上游组件的组件信息包括所述上游组件的组件标识信息;所述下游组件的组件信息包括所述下游组件的组件标识信息;
所述在可视化界面创建所述下游组件与所述上游组件之间的数据吞吐链,包括:
根据所述上游组件的组件标识信息和所述下游组件的组件标识信息,创建所述上游组件与所述下游组件之间的数据流向路径;所述数据流向路径为所述上游组件指向所述下游组件的路径;
将所述数据流向路径添加至路径数组中;所述路径数组中包括多个元素,一个元素对应于一条数据流向路径;
根据所述路径数组,在所述可视化界面中创建所述下游组件与所述上游组件之间的所述数据吞吐链;所述路径数组中的一条数据流向路径对应于一条数据吞吐链。
7.根据权利要求1所述的方法,其特征在于,还包括:
获取所述数据处理评估参数对应的数据处理评估指标;
当所述数据处理评估参数的参数值未达到所述数据处理评价指标的指标值时,将所述数据吞吐链在所述可视化界面中进行突出显示。
8.根据权利要求1所述的方法,其特征在于,所述获取下游组件针对数据流的第一数据处理结果,获取所述下游组件的上游组件针对所述数据流的第二数据处理结果,包括:
根据所述上游组件的组件标识信息,从哈希表中获取所述上游组件对应的组件上下游关系信息和所述上游组件的所述第二数据处理结果;
在所述组件上下游关系信息中,获取所述下游组件的组件标识信息,根据所述下游组件的组件标识信息获取所述下游组件对应的结果映射关系信息;
在所述结果映射关系信息中获取所述下游组件对应的所述第一数据处理结果。
9.根据权利要求8所述的方法,其特征在于,还包括:
从数据库中获取所述下游组件的组件详情信息;所述组件详情信息中包括所述下游组件的组件标识信息和所述下游组件的所述上游组件的组件标识信息;
根据所述上游组件的组件标识信息和所述下游组件的组件标识信息,生成所述下游组件与所述上游组件之间的所述组件上下游关系信息;
从所述组件详情信息中获取所述下游组件对应的所述第一数据处理结果,根据所述第一数据处理结果和所述下游组件的组件标识信息生成所述结果映射关系信息;
将所述组件上下游关系信息和所述结果映射关系信息,添加至所述哈希表中。
10.一种数据可视化装置,其特征在于,包括:
结果获取模块,用于获取下游组件针对数据流的第一数据处理结果,获取所述下游组件的上游组件针对所述数据流的第二数据处理结果;
参数获取模块,用于根据所述第一数据处理结果和所述第二数据处理结果,获取所述下游组件针对所述数据流的数据处理评估参数;
创建模块,用于在可视化界面创建所述下游组件与所述上游组件之间的数据吞吐链;所述数据吞吐链包括所述上游组件与所述下游组件之间的数据处理流向关系、所述上游组件的组件信息以及所述下游组件的组件信息;
输出模块,用于在所述可视化界面中的所述数据吞吐链所在位置处,输出所述数据处理评估参数。
11.根据权利要求10所述的方法,其特征在于,所述第二数据处理结果为空;所述参数获取模块,包括:
第一获取单元,用于从所述第一数据处理结果中,获取所述下游组件针对所述数据流的数据处理失败量;
第一确定单元,用于将所述数据处理失败量,确定为所述数据处理评估参数。
12.根据权利要求11所述的方法,其特征在于,所述数据可视化装置,还包括:
第一消息生成模块,用于当所述数据处理失败量大于数据处理失败量阈值时,根据所述数据处理失败量和所述下游组件的组件信息,生成第一告警消息;
第一消息发送模块,用于将所述第一告警消息发送至告警设备。
13.根据权利要求10所述的方法,其特征在于,所述第二数据处理结果中包括所述上游组件的出口数据;所述出口数据属于所述数据流;所述出口数据为所述上游组件向所述下游组件所发送的数据;
所述参数获取模块,包括:
第二获取单元,用于从所述第一数据处理结果中获取所述下游组件针对所述出口数据的数据处理量;
处理率确定单元,用于根据所述数据处理量与所述出口数据的数据量,确定所述下游组件针对所述出口数据的数据成功处理率;
第二确定单元,用于将所述数据成功处理率确定为所述数据处理评估参数。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1-9中任一项所述方法的步骤。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-9任一项所述的方法。
CN202010104892.5A 2020-02-20 2020-02-20 一种数据可视化方法、装置以及计算机可读存储介质 Active CN111339138B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010104892.5A CN111339138B (zh) 2020-02-20 2020-02-20 一种数据可视化方法、装置以及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010104892.5A CN111339138B (zh) 2020-02-20 2020-02-20 一种数据可视化方法、装置以及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111339138A true CN111339138A (zh) 2020-06-26
CN111339138B CN111339138B (zh) 2024-05-17

Family

ID=71181693

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010104892.5A Active CN111339138B (zh) 2020-02-20 2020-02-20 一种数据可视化方法、装置以及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111339138B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050131927A1 (en) * 2003-12-11 2005-06-16 Ulf Fildebrandt Data dependency visualization
CN101404696A (zh) * 2008-11-03 2009-04-08 中兴通讯股份有限公司 可视化业务流程跟踪方法和系统、业务流程处理系统
WO2009065937A1 (de) * 2007-11-23 2009-05-28 Siemens Aktiengesellschaft Verfahren, verwendungen und vorrichtung zum erkennen von zumindest einem fehlerhaft arbeitenden knoten
CN104992301A (zh) * 2015-07-24 2015-10-21 广州支点网络科技有限公司 跨越企业/组织的项目管理的流程流转控制方法、装置
JP2015230702A (ja) * 2014-06-06 2015-12-21 株式会社リコー 処理フロー生成装置、処理フロー生成方法、処理フロー生成プログラム、情報処理装置の製造方法及び情報処理プログラムの製造方法
CN109189381A (zh) * 2018-10-18 2019-01-11 行吟信息科技(上海)有限公司 一种业务流组件的创建方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050131927A1 (en) * 2003-12-11 2005-06-16 Ulf Fildebrandt Data dependency visualization
WO2009065937A1 (de) * 2007-11-23 2009-05-28 Siemens Aktiengesellschaft Verfahren, verwendungen und vorrichtung zum erkennen von zumindest einem fehlerhaft arbeitenden knoten
CN101404696A (zh) * 2008-11-03 2009-04-08 中兴通讯股份有限公司 可视化业务流程跟踪方法和系统、业务流程处理系统
JP2015230702A (ja) * 2014-06-06 2015-12-21 株式会社リコー 処理フロー生成装置、処理フロー生成方法、処理フロー生成プログラム、情報処理装置の製造方法及び情報処理プログラムの製造方法
CN104992301A (zh) * 2015-07-24 2015-10-21 广州支点网络科技有限公司 跨越企业/组织的项目管理的流程流转控制方法、装置
CN109189381A (zh) * 2018-10-18 2019-01-11 行吟信息科技(上海)有限公司 一种业务流组件的创建方法及装置

Also Published As

Publication number Publication date
CN111339138B (zh) 2024-05-17

Similar Documents

Publication Publication Date Title
CN104407964B (zh) 一种基于数据中心的集中监控系统及方法
CN111368089B (zh) 一种基于知识图谱的业务处理方法及装置
CN105159964A (zh) 一种日志监控方法及系统
US11126614B2 (en) Log query user interface
CN106161060B (zh) 数据监控方法和装置
CN105653425A (zh) 基于复杂事件处理引擎的监控系统
CN113704065A (zh) 监控方法、装置、设备及计算机存储介质
CN101989931A (zh) 一种运维告警处理方法和装置
CN110968479B (zh) 一种针对应用程序的业务级全链路监控方法及服务器
CN112052134A (zh) 一种业务数据的监控方法及装置
CN110781009A (zh) 浏览器页面实时通信的方法及装置
CN113656252B (zh) 故障定位方法、装置、电子设备以及存储介质
CN113821538A (zh) 一种基于元数据的流式数据处理系统
CN114756301B (zh) 日志处理方法、装置和系统
CN111339138A (zh) 一种数据可视化方法、装置以及计算机可读存储介质
CN105446707B (zh) 一种数据转换方法
WO2023273461A1 (zh) 机器人运营状态监控系统及方法
CN114706893A (zh) 故障检测方法、装置、设备及存储介质
CN110611576B (zh) 一种数据质量监测方法、装置、设备及存储介质
CN104376027A (zh) 基于社会化媒体的信息采集分析系统及其方法
CN113691392A (zh) 一种基于业务规则的物联网报警系统
CN112099899B (zh) 工业数据的可视化处理方法、装置和电子设备
CN114911654A (zh) 一种故障分类方法、装置及系统
CN113779098B (zh) 数据处理方法、装置、电子设备以及存储介质
CN114500227B (zh) 一种告警分析方法、装置、设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40023609

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant