CN115858893B - 数据可视化分析方法、装置、电子设备及存储介质 - Google Patents

数据可视化分析方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115858893B
CN115858893B CN202310188025.8A CN202310188025A CN115858893B CN 115858893 B CN115858893 B CN 115858893B CN 202310188025 A CN202310188025 A CN 202310188025A CN 115858893 B CN115858893 B CN 115858893B
Authority
CN
China
Prior art keywords
data
data source
field
chart
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310188025.8A
Other languages
English (en)
Other versions
CN115858893A (zh
Inventor
曾勇
刘桂奇
廖石阳
邹稳安
姚季平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Extreme Data Beijing Technology Co ltd
Original Assignee
Extreme Data Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Extreme Data Beijing Technology Co ltd filed Critical Extreme Data Beijing Technology Co ltd
Priority to CN202310188025.8A priority Critical patent/CN115858893B/zh
Publication of CN115858893A publication Critical patent/CN115858893A/zh
Application granted granted Critical
Publication of CN115858893B publication Critical patent/CN115858893B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种数据可视化分析方法、装置、电子设备及存储介质,该方法包括:获取第一数据源,第一数据源包括多种结构的数据源。根据第一数据源的结构种类生成对应的JSON对象模型,并通过JSON对象模型创建数据源索引,数据源索引用于检索不同结构的数据源。通过检索获取第二数据源,第二数据源为通过数据源索引检索后得到的目标数据源。对第二数据源进行数据分析,以得到第二数据源的字段分组,字段分组为数据源的数据类型。当第二数据源具有多个字段分组时,判断字段分组的数量是否超过第一阈值以及字段分组中是否具有时间字段,若字段分组的数量超过第一阈值且具有时间字段,则优先匹配第一图表数据,否则,匹配第二图表数据。

Description

数据可视化分析方法、装置、电子设备及存储介质
技术领域
本申请涉及数据分析技术领域,特别是涉及一种数据可视化分析方法、装置、电子设备及存储介质。
背景技术
随着互联网技术的快速发展、大数据时代的到来,企业内部数据有了爆发式增长,面对海量数据,及时有效地进行可视化分析具有重要的意义。同时能够将数据进行价值变现,也便于企业管理层的正确决策。因此,如何进行有效快速可视化分析是很多企业需要面对和解决的问题。
目前,现有的数据可视化分析方式一般是通过导入静态数据到本地软件进行分析,例如Excel等,这种传统的手动操作方式比较繁琐且效率较低,适用于小数据场景。因此,部分企业开始通过定制开发数据可视化分析报表,并通过UI前端调用服务端API接口拿到动态数据进行图表渲染,该方式中的图表类型比较固定,如果需要新增图表或分析项目需要定制开发,灵活性较差。还有通过Kibana(开源的分析和可视化平台)作为数据分析工具,可自定义创造可视化图表Dashboard(仪表盘),基于Elasticsearch(分布式搜索引擎)数据源,用户可以在Kibana界面上根据自己的需求自定义编辑和生成可视化图表,这种方式比较灵活,适用于大数据场景,但是上手难度比较大,需要专业人员配置和操作。另外,当前主流的可视化分析方式都需要手动配置报表,并且报表配置好了之后都是静态的内容,而数据往往一直在变化,配置时的指标和视图往往有限,或者随着时间推移而无法反映当前数据的变化,导致无法发现重要指标,并且现在企业的各类统计指标越来越多,往往动辄几千上万的指标,从海量指标信息里面往往无法有效地找到重要信息。
综上所述,一般的数据可视化分析方法在处理大数据的过程中由于数据的动态变化以及配置的限制,导致一般的数据可视化分析方法在处理海量变化指标信息的过程中准确性较差,进而导致无法及时突出重要指标信息。
发明内容
基于此,有必要针对上述技术问题,提供一种在大数据分析中准确性较高的数据可视化分析方法、装置、电子设备及存储介质。
第一方面,本申请提供一种数据可视化分析方法,所述方法包括:
获取第一数据源,所述第一数据源包括多种结构的数据源;
根据所述第一数据源的结构种类生成对应的JSON对象模型,并通过所述JSON对象模型创建数据源索引,所述数据源索引用于检索不同结构的数据源;
通过检索获取第二数据源,所述第二数据源为通过所述数据源索引检索后得到的目标数据源;
对所述第二数据源进行数据分析,以得到所述第二数据源的字段分组,所述字段分组为数据源的数据类型;
当所述第二数据源具有多个字段分组时,判断所述字段分组的数量是否超过第一阈值以及所述字段分组中是否具有时间字段,若所述字段分组的数量超过第一阈值且具有时间字段,则优先匹配第一图表数据,否则,匹配第二图表数据;
其中,所述第一图表数据为以时间为横坐标的统计图表,所述第二图表数据为不具有时间变量的统计图表。
在其中一个实施例中,所述第一数据源包括业务数据、系统日志数据以及系统监控指标数据,所述根据所述第一数据源的结构种类生成对应的JSON对象模型,并通过所述JSON对象模型创建数据源索引,包括:
创建第一映射关系,所述第一映射关系为所述第一数据源的索引名与对应数据源之间的映射关系;
将所述第一映射关系缓存至分布式搜索引擎。
在其中一个实施例中,所述通过检索获取第二数据源,包括:
根据所述第一数据源的索引名和时间范围获取第一请求指令;
根据所述第一请求指令获取对应索引名和时间范围的数据源。
在其中一个实施例中,所述字段分组包括数字字段、时间字段、关键字字段、文本字段以及布尔值字段,所述对所述第二数据源进行数据分析,包括:
对所述第二数据源进行字段分组分析;
根据字段分组分析结果获取所述第二数据源的字段分组。
在其中一个实施例中,所述判断所述字段分组的数量是否超过第一阈值以及所述字段分组中是否具有时间字段,之后包括:
当所述字段分组的数量超过第一阈值且具有时间分组时,对所述第二数据源进行权重分析,以获取权重分析结果;
基于所述权重分析结果,通过图表组件对所述第一图表数据进行优先可视化渲染选择;
将优先可视化渲染的第一图表数据发送至UI界面进行显示。
在其中一个实施例中,所述方法还包括:
当所述第二数据源具有唯一一个字段分组时,则判定所述字段分组为不重要指标;
当所述字段分组为不重要指标时,排除丢弃所述不重要指标对应的第二数据源。
在其中一个实施例中,所述方法还包括:
通过图表组件对所述第一图表数据和/或第二图表数据进行可视化渲染;
将渲染后的第一图表数据和/或第二图表数据发送至UI界面进行显示。
第二方面,本申请提供一种数据可视化分析装置,所述装置包括:
数据源获取模块,用于获取第一数据源,所述第一数据源包括多种结构的数据源;
索引创建模块,用于根据所述第一数据源的结构种类生成对应的JSON对象模型,并通过所述JSON对象模型创建数据源索引,所述数据源索引用于检索不同结构的数据源;
检索模块,用于通过检索获取第二数据源,所述第二数据源为通过所述数据源索引检索后得到的目标数据源;
数据分析模块,用于对所述第二数据源进行数据分析,以得到所述第二数据源的字段分组,所述字段分组为数据源的数据类型;
图表匹配模块,用于当所述第二数据源具有多个字段分组时,判断所述字段分组的数量是否超过第一阈值以及所述字段分组中是否具有时间字段,若所述字段分组的数量超过第一阈值且具有时间字段,则优先匹配第一图表数据,否则,匹配第二图表数据;
其中,所述第一图表数据为以时间为横坐标的统计图表,所述第二图表数据为不具有时间变量的统计图表。
第三方面,本申请提供一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取第一数据源,所述第一数据源包括多种结构的数据源;
根据所述第一数据源的结构种类生成对应的JSON对象模型,并通过所述JSON对象模型创建数据源索引,所述数据源索引用于检索不同结构的数据源;
通过检索获取第二数据源,所述第二数据源为通过所述数据源索引检索后得到的目标数据源;
对所述第二数据源进行数据分析,以得到所述第二数据源的字段分组,所述字段分组为数据源的数据类型;
当所述第二数据源具有多个字段分组时,判断所述字段分组的数量是否超过第一阈值以及所述字段分组中是否具有时间字段,若所述字段分组的数量超过第一阈值且具有时间字段,则优先匹配第一图表数据,否则,匹配第二图表数据;
其中,所述第一图表数据为以时间为横坐标的统计图表,所述第二图表数据为不具有时间变量的统计图表。
第四方面,本申请提供一种计算机存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取第一数据源,所述第一数据源包括多种结构的数据源;
根据所述第一数据源的结构种类生成对应的JSON对象模型,并通过所述JSON对象模型创建数据源索引,所述数据源索引用于检索不同结构的数据源;
通过检索获取第二数据源,所述第二数据源为通过所述数据源索引检索后得到的目标数据源;
对所述第二数据源进行数据分析,以得到所述第二数据源的字段分组,所述字段分组为数据源的数据类型;
当所述第二数据源具有多个字段分组时,判断所述字段分组的数量是否超过第一阈值以及所述字段分组中是否具有时间字段,若所述字段分组的数量超过第一阈值且具有时间字段,则优先匹配第一图表数据,否则,匹配第二图表数据;
其中,所述第一图表数据为以时间为横坐标的统计图表,所述第二图表数据为不具有时间变量的统计图表。
上述数据可视化分析方法、装置、电子设备及存储介质,根据不同结构的数据源生成对应的JSON对象模型来创建数据源与数据源种类之间的索引,可根据需求在创建好的数据源索引中获取目标数据源,然后通过对目标数据源的结构分析获取对应数据源中的字段分组,最后根据字段分组的数量以及字段分组的种类匹配合适的图表数据,并对目标数据源匹配的图表数据进行可视化渲染展示。该方法基于数据源的结构特征,计算出数据源多维度的统计数据,在大数据分析的过程中可根据需求检索到对应数据源的变化及其重要指标,在动态大数据分析过程中具有较高的准确性。
附图说明
图1为本申请的数据可视化分析方法流程图之一;
图2为本申请的数据可视化分析方法流程图之二;
图3为本申请的数据可视化分析方法流程图之三;
图4为本申请的数据可视化分析方法流程图之四;
图5为本申请的数据可视化分析方法流程图之五;
图6为本申请的数据可视化分析方法流程图之六;
图7为本申请中一个实施例的数据可视化分析方案的基于数据源从输入到输出的流程图;
图8为本实施例的数据可视化分析方案的数据聚合计算的流程图;
图9为本申请的数据可视化分析装置结构示意图;
图10为本申请中一个实施例的计算机设备的内部结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,在一个实施例中,一种数据可视化分析方法,包括以下步骤:
步骤S110,获取第一数据源,第一数据源包括多种结构的数据源。
具体地,服务端获取多种结构的数据源。
步骤S120,根据第一数据源的结构种类生成对应的JSON对象模型,并通过JSON对象模型创建数据源索引,数据源索引用于检索不同结构的数据源。
具体地,服务端根据步骤S110中获取到的多种结构的数据源的结构种类生成相应的JSON对象模型,所生成的JSON对象模型用于创建数据源索引以根据需求检索不同结构的数据源。
步骤S130,通过检索获取第二数据源,第二数据源为通过数据源索引检索后得到的目标数据源。
具体地,服务端根据用户需求通过检索步骤S120中创建的数据源索引获取待分析的目标数据源。
步骤S140,对第二数据源进行数据分析,以得到第二数据源的字段分组,字段分组为数据源的数据类型。
具体地,服务端对步骤S130中检索到的目标数据源进行数据分析来获取该目标数据源中包含的数据类型。
步骤S150,当第二数据源具有多个字段分组时,判断字段分组的数量是否超过第一阈值以及字段分组中是否具有时间字段,若字段分组的数量超过第一阈值且具有时间字段,则优先匹配第一图表数据,否则,匹配第二图表数据。
具体地,当目标数据源的数据分析结果显示该目标数据源中的数据类型超过一个字段分组时,服务端会判断字段分组的数量是否超过预设值以及字段分组中是否具有时间字段,若判断结果显示该目标数据源中的字段分组的数量超过了预设值且包含有时间字段,服务端则会优先为该目标数据源匹配以时间为横坐标的统计图表,即折线图、柱状图、面积图等展现场景。若判断结果显示该目标数据源中的字段分组的数量未超过预设值且不含有时间字段,服务端则会优先为该目标数据源匹配不具有时间变量的统计图表,即饼图、仪表盘图等展现场景。
上述数据可视化分析方法,根据不同结构的数据源生成对应的JSON对象模型来创建数据源与数据源种类之间的索引,可根据需求在创建好的数据源索引中获取目标数据源,然后通过对目标数据源的结构分析获取对应数据源中的字段分组,最后根据字段分组的数量以及字段分组的种类匹配合适的图表数据,并对目标数据源匹配的图表数据进行可视化渲染展示。该方法基于数据源的结构特征,计算出数据源多维度的统计数据,在大数据分析的过程中可根据需求检索到对应数据源的变化及其重要指标,在动态大数据分析过程中具有较高的准确性。
如图2所示,在一个实施例中,根据第一数据源的结构种类生成对应的JSON对象模型,并通过JSON对象模型创建数据源索引,包括以下步骤:
步骤S122,创建第一映射关系,第一映射关系为第一数据源的索引名与对应数据源之间的映射关系。
具体地,第一数据源包括业务数据、系统日志数据以及系统监控指标数据等不同数据结构的数据源,服务端基于每一类数据源的结构生成对应的JSON对象模型,根据生成的JSON对象模型创建第一数据源的索引名与索引名对应的数据源之间的映射关系。
步骤S124,将第一映射关系缓存至分布式搜索引擎。
具体地,服务端将步骤S122中创建好的映射关系缓存至分布式搜索引擎,以便于后续对数据源的检索和分析。
如图3所示,在一个实施例中,对第二数据源进行数据分析,包括以下步骤:
步骤S142,对第二数据源进行字段分组分析。
具体地,服务端对获取到的目标数据源进行字段分组分析字段分组包括数字字段、时间字段、关键字字段、文本字段以及布尔值字段,
步骤S144,根据字段分组分析结果获取第二数据源的字段分组。
具体地,服务端根据步骤S142中对目标数据源字段分组的分析结果获取该目标数据源中的具体字段分组。
如图4所示,在一个实施例中,一种数据可视化分析方法,判断字段分组的数量是否超过第一阈值以及字段分组中是否具有时间字段,之后包括以下步骤:
步骤S410,当字段分组的数量超过第一阈值且具有时间分组时,对第二数据源进行权重分析,以获取权重分析结果。
具体的,当字段分组的数量超过设定的第一阈值且具有时间分组时,服务端对第二数据源进行权重分析,以获取权重分析结果。
其中,权重分析用于根据第二数据源的变化幅度对第二数据源进行权重打分,第二数据源的变化幅度越大,其获取的权重评分越高。
步骤S420,基于权重分析结果,通过图表组件对第一图表数据进行优先可视化渲染选择。
具体的,服务端根据步骤S410对第二数据源的权重评分结果,通过图表组件对第二数据源对应的图表数据进行优先可视化渲染选择,使得权重评分较高的第二数据源所对应的图表数据被优先可视化渲染。
步骤S430,将优先可视化渲染的第一图表数据发送至UI界面进行显示。
具体的,服务端将步骤S420中优先可视化渲染的图表数据发送至UI界面进行显示。
如图5所示,在一个实施例中,一种数据可视化分析方法,还包括以下步骤:
步骤S510,当第二数据源具有唯一一个字段分组时,则判定字段分组为不重要指标。
具体地,当目标数据源只有一个字段分组时,服务端则会自动判定该目标数据源为不重要指标。
步骤S520,当字段分组为不重要指标时,排除丢弃不重要指标对应的第二数据源。
具体地,当步骤S510中判定目标数据源的字段分组为不重要指标时,服务端则会排除丢弃该不重要指标对应的目标数据源。
需要说明的是,因为目标数据源只有一个分组字段说明数据指标本身没有波动变化,不具备分析价值,所以判定为不重要指标,对于不重要指标可对其进行排除丢弃。另外,若数据源分布在稳定的区间范围内,数据呈现周期的运动,则说明该数据源不具备异常变化,同样可以排除丢弃,数据的周期性变化可以结合历史的数据来进行判断其是否存在稳定周期变化,如本周与上周、本月与上月等时间周期。
如图6所示,在一个实施例中,一种数据可视化分析方法,还包括以下步骤:
步骤S610,通过图表组件对第一图表数据和/或第二图表数据进行可视化渲染。
具体地,服务端在匹配好图表数据后通过图表组件对匹配好的图表数据进行可视化渲染,且不同的图表数据选择不同的图表组件进行可视化渲染。
步骤S620,将渲染后的第一图表数据和/或第二图表数据发送至UI界面进行显示。
具体地,服务端在步骤S610对不同图表的可视化渲染将渲染后的图表数据发送到UI界面(人机交互界面)进行显示。
如图7至图8所示,在一个实施例中,一种数据可视化分析方案,首先,导入数据源,数据源包含业务数据、系统日志数据、系统监控指标数据等,每一种数据源的数据结构各异,后端程序基于每一类数据源的结构生成对应的JSON对象模型,并创建索引Mapping(映射关系),然后存入Elasticsearch(分布式搜索引擎)。有了源数据索引之后,通过WEB前端UI界面,选择一个索引名,同时选一个时间范围(如不选时间则默认最近15分钟),再点击刷新按钮,刷新操作将由WEB前端触发HTTP GET请求,带上索引名、时间范围参数一并提交给后端程序,后端程序接收到请求后将会做下一步数据计算分析。
后端程序将预先导入的数据源及其索引名和时间范围进一步封装为Elasticsearch Query(分布式搜索引擎查询),然后调用Elasticsearch Query Api(分布式搜索引擎查询接口)获得目标数据结果集,目标数据结果集中存储有待分析的目标数据源。接下来基于获得的数据结果集进行数据分析,分析数据的特征以找到重要的指标,分析数据维度主要包含的数据类型有数字、时间、Keyword(关键字)、文本和布尔值,不同类型的数据采用不同的分析方法,对于数值类型的数据源,通过对其进行字段分析获取对应目标数据源的字段分组,并判断字段分组是否存在唯一值,若存在唯一值则说明统计结果中目标数据源只有一个分组,此时则判定该目标数据源为不重要的指标,因为目标数据源只有一个分组说明数据指标本身没有波动变化,不具备分析价值,所以判定为不重要指标,对于不重要指标可对其进行排除丢弃。
另外,若数据源分布在稳定的区间范围内,数据呈现周期的运动,则说明该数据源不具备异常变化,同样可以排除丢弃,若数据存在异常,即数据波动幅度太大时,后端程序则会通过告警接口(Alerting)对外发送告警指令,以提示用户数据异常。数据的周期性变化可以结合历史的数据来进行判断其是否存在稳定周期变化,如本周与上周、本月与上月等时间周期,根据数据变化幅度进行同比或环比。若统计结果中目标数据源有多个字段分组,可以判断字段分组内结果集是否超过设定的阈值N(N数值可以按需设定),如果超过该设定阈值且字段分组内有时间字段则优先选择折线图、柱状图、面积图等时间作为横向坐标的图表数据,如果不超过设定阈值并且字段分组内没有时间字段则优先匹配饼图、仪表盘图等不具有时间变量的图表数据。
当统计结果中目标数据源的字段分组数量超过设定阈值N,且在其字段分组中具有时间字段,后端程序则会根据目标数据源的变化幅度对目标数据源进行权重分析,若目标数据源的变化幅度越大,则权重评分就越高,图表组件会优先将权重评分较高的目标数据源对应的图表数据进行可视化渲染,并将可视化渲染后的图表数据发送UI界面进行优先显示。
后端程序将匹配的图表数据回传给WEB前端,由于回传数据是服务端动态实时产生,为了减少WEB前端和服务端之间的网络连接开销,同时支持实时的数据响应,采用长链接Websocket协议(全双工协议),使得WEB前端和服务器之间的数据交换变得更加简单,允许服务端主动向WEB前端推送数据。WEB前端浏览器和服务器只需要完成一次握手,两者之间就直接可以创建持久性连接,并进行双向数据传输。当WEB前端接收到服务端推送的图表数据时,再由图表组件进行可视化渲染,图表组件基于开源图表库(Antd Design Charts),渲染处理过程为WEB前端根据接收到的不同的图表类型分别调用不同的图表组件API(接口),图表组件依据输入的数据进行渲染,渲染后的图表集在前端UI界面(人机交互界面)是可以支持自由切换,同时也支持以拖拽的方式进行自定义布局,进而取得最佳的可视化图表展现效果。
上述数据可视化分析方案,基于数据的元数据及其各自的特征,通过后端算法自动计算出多维度的统计数据,并自动评估判断各个指标的重要度和是否存在分析价值,进行指标分析并挑选出重要指标,再通过Websocket(全双工协议)将数据实时推送至WEB前端UI界面(人机交互界面)进行渲染展示,支持自动生成可视化图表Dashboard(仪表盘),用户无需任何操作,降低了用户使用难度,另外Dashboard(仪表盘)采用的是动态视图,不同时间可以看到的指标均是当前最重要的指标,相比传统的静态报告更具备分析价值,能够第一时间定位重要的指标并及时发现问题。另外,该方案通过UI界面(人机交互界面)支持用户自定义图表排版布局,且能够自由切换图表类型以及增删改图表,在大数据场景中具有灵活多变的使用方式,在一定程度上提高了数据分析的准确性。
如图9所示,在一个实施例中,一种数据可视化分析装置,包括数据源获取模块910、索引创建模块920、检索模块930、数据分析模块940和图表匹配模块950。
数据源获取模块910用于获取第一数据源,第一数据源包括多种结构的数据源。
索引创建模块920用于根据第一数据源的结构种类生成对应的JSON对象模型,并通过JSON对象模型创建数据源索引,数据源索引用于检索不同结构的数据源。
检索模块930用于通过检索获取第二数据源,第二数据源为通过数据源索引检索后得到的目标数据源。
数据分析模块940用于对第二数据源进行数据分析,以得到第二数据源的字段分组,字段分组为数据源的数据类型。
图表匹配模块950用于当第二数据源具有多个字段分组时,判断字段分组的数量是否超过第一阈值以及字段分组中是否具有时间字段,若字段分组的数量超过第一阈值且具有时间字段,则优先匹配第一图表数据,否则,匹配第二图表数据。
上述数据可视化分析装置,根据不同结构的数据源生成对应的JSON对象模型来创建数据源与数据源种类之间的索引,可根据需求在创建好的数据源索引中获取目标数据源,然后通过对目标数据源的结构分析获取对应数据源中的字段分组,最后根据字段分组的数量以及字段分组的种类匹配合适的图表数据,并对目标数据源匹配的图表数据进行可视化渲染展示。该装置基于数据源的结构特征,计算出数据源多维度的统计数据,在大数据分析的过程中可根据需求检索到对应数据源的变化及其重要指标,在动态大数据分析过程中具有较高的准确性。
在一个实施例中,索引创建模块具体用于:
创建第一映射关系,第一映射关系为第一数据源的索引名与对应数据源之间的映射关系。
将第一映射关系缓存至分布式搜索引擎。
在一个实施例中,数据分析模块具体用于:
对第二数据源进行字段分组分析。
根据字段分组分析结果获取第二数据源的字段分组。
在一个实施例中,一种数据可视化分析装置,还包括权重分析模块、优先渲染模块和优先显示模块。
权重分析模块用于当字段分组的数量超过第一阈值且具有时间分组时,对第二数据源进行权重分析,以获取权重分析结果。
优先渲染模块用于基于权重分析结果,通过图表组件对第一图表数据进行优先可视化渲染选择。
优先显示模块用于将优先可视化渲染的第一图表数据发送至UI界面进行显示。
在一个实施例中,一种数据可视化分析装置,还包括指标判定模块和排除丢弃模块。
指标判定模块用于当第二数据源具有唯一一个字段分组时,则判定字段分组为不重要指标。
排除丢弃模块用于当字段分组为不重要指标时,排除丢弃不重要指标对应的第二数据源。
在一个实施例中,一种数据可视化分析装置,还包括可视化渲染模块和显示模块。
可视化渲染模块用于通过图表组件对第一图表数据和/或第二图表数据进行可视化渲染。
显示模块用于将渲染后的第一图表数据和/或第二图表数据发送至UI界面进行显示。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是智能终端,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据可视化分析方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,一种电子设备,包括存储器和处理器,存储器存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,一种计算机存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种数据可视化分析方法,其特征在于,所述方法包括:
获取第一数据源,所述第一数据源包括多种结构的数据源;
根据所述第一数据源的结构种类生成对应的JSON对象模型,并通过所述JSON对象模型创建数据源索引,所述数据源索引用于检索不同结构的数据源;
通过检索获取第二数据源,所述第二数据源为通过所述数据源索引检索后得到的目标数据源;
对所述第二数据源进行数据分析,以得到所述第二数据源的字段分组,所述字段分组为数据源的数据类型;
当所述第二数据源具有多个字段分组时,判断所述字段分组的数量是否超过第一阈值以及所述字段分组中是否具有时间字段,若所述字段分组的数量超过第一阈值且具有时间字段,则优先匹配第一图表数据,否则,匹配第二图表数据;
当所述字段分组的数量超过第一阈值且具有时间分组时,对所述第二数据源进行权重分析,以获取权重分析结果;
基于所述权重分析结果,通过图表组件对所述第一图表数据进行优先可视化渲染选择;
将优先可视化渲染的第一图表数据发送至UI界面进行显示;
其中,所述第一图表数据为以时间为横坐标的统计图表,所述第二图表数据为不具有时间变量的统计图表。
2.根据权利要求1所述的数据可视化分析方法,其特征在于,所述第一数据源包括业务数据、系统日志数据以及系统监控指标数据,所述根据所述第一数据源的结构种类生成对应的JSON对象模型,并通过所述JSON对象模型创建数据源索引,包括:
创建第一映射关系,所述第一映射关系为所述第一数据源的索引名与对应数据源之间的映射关系;
将所述第一映射关系缓存至分布式搜索引擎。
3.根据权利要求2所述的数据可视化分析方法,其特征在于,所述通过检索获取第二数据源,包括:
根据所述第一数据源的索引名和时间范围获取第一请求指令;
根据所述第一请求指令获取对应索引名和时间范围的数据源。
4.根据权利要求1所述的数据可视化分析方法,其特征在于,所述字段分组包括数字字段、时间字段、关键字字段、文本字段以及布尔值字段,所述对所述第二数据源进行数据分析,包括:
对所述第二数据源进行字段分组分析;
根据字段分组分析结果获取所述第二数据源的字段分组。
5.根据权利要求1所述的数据可视化分析方法,其特征在于,所述方法还包括:
当所述第二数据源具有唯一一个字段分组时,则判定所述字段分组为不重要指标;
当所述字段分组为不重要指标时,排除丢弃所述不重要指标对应的第二数据源。
6.根据权利要求1所述的数据可视化分析方法,其特征在于,所述方法还包括:
通过图表组件对所述第一图表数据和/或第二图表数据进行可视化渲染;
将渲染后的第一图表数据和/或第二图表数据发送至UI界面进行显示。
7.一种数据可视化分析装置,其特征在于,所述装置包括:
数据源获取模块,用于获取第一数据源,所述第一数据源包括多种结构的数据源;
索引创建模块,用于根据所述第一数据源的结构种类生成对应的JSON对象模型,并通过所述JSON对象模型创建数据源索引,所述数据源索引用于检索不同结构的数据源;
检索模块,用于通过检索获取第二数据源,所述第二数据源为通过所述数据源索引检索后得到的目标数据源;
数据分析模块,用于对所述第二数据源进行数据分析,以得到所述第二数据源的字段分组,所述字段分组为数据源的数据类型;
图表匹配模块,用于当所述第二数据源具有多个字段分组时,判断所述字段分组的数量是否超过第一阈值以及所述字段分组中是否具有时间字段,若所述字段分组的数量超过第一阈值且具有时间字段,则优先匹配第一图表数据,否则,匹配第二图表数据;
当所述字段分组的数量超过第一阈值且具有时间分组时,对所述第二数据源进行权重分析,以获取权重分析结果;
基于所述权重分析结果,通过图表组件对所述第一图表数据进行优先可视化渲染选择;
将优先可视化渲染的第一图表数据发送至UI界面进行显示;
其中,所述第一图表数据为以时间为横坐标的统计图表,所述第二图表数据为不具有时间变量的统计图表。
8.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202310188025.8A 2023-03-02 2023-03-02 数据可视化分析方法、装置、电子设备及存储介质 Active CN115858893B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310188025.8A CN115858893B (zh) 2023-03-02 2023-03-02 数据可视化分析方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310188025.8A CN115858893B (zh) 2023-03-02 2023-03-02 数据可视化分析方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN115858893A CN115858893A (zh) 2023-03-28
CN115858893B true CN115858893B (zh) 2023-04-28

Family

ID=85659667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310188025.8A Active CN115858893B (zh) 2023-03-02 2023-03-02 数据可视化分析方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115858893B (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9183561B2 (en) * 2011-08-10 2015-11-10 Microsoft Technology Licensing, Llc Automatic generation of trend charts
WO2016203652A1 (ja) * 2015-06-19 2016-12-22 株式会社Ubic データ分析に係るシステム、制御方法、制御プログラム、および、その記録媒体
CN110618983B (zh) * 2019-08-15 2023-01-06 复旦大学 基于json文档结构的工业大数据多维分析与可视化方法
US11514030B2 (en) * 2020-11-11 2022-11-29 Yahoo Assets Llc Automated materialized view table generation and maintenance
CN113763502B (zh) * 2020-11-13 2024-04-16 北京京东尚科信息技术有限公司 一种图表生成方法、装置、设备和存储介质
CN112597273A (zh) * 2020-12-02 2021-04-02 国网浙江省电力有限公司台州供电公司 一种基于nl2sql技术的配电自动化图表生成方法
CN113807066A (zh) * 2021-09-16 2021-12-17 东软集团股份有限公司 一种图表生成方法、装置及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
VFP中生成动态统计图表的二个方法;涂为员,戴洪萍;福建电脑(第07期);全文 *
VizLinter: A Linter and Fixer Framework for Data Visualization;Qing Chen等;《IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS》;第第28卷卷(第第1期期);第206-216页 *

Also Published As

Publication number Publication date
CN115858893A (zh) 2023-03-28

Similar Documents

Publication Publication Date Title
US11120344B2 (en) Suggesting follow-up queries based on a follow-up recommendation machine learning model
US11914588B1 (en) Determining a user-specific approach for disambiguation based on an interaction recommendation machine learning model
US11853303B1 (en) Data stream generation based on sourcetypes associated with messages
US10885026B2 (en) Translating a natural language request to a domain-specific language request using templates
US10713269B2 (en) Determining a presentation format for search results based on a presentation recommendation machine learning model
AU2015225870B2 (en) System and methods for cleansing automated robotic traffic from sets of usage logs
US11768776B1 (en) Evicting data associated with a data intake and query system from a local storage
US10572811B2 (en) Methods and systems for determining probabilities of occurrence for events and determining anomalous events
US11556592B1 (en) Storage estimate generation
WO2020087082A1 (en) Trace and span sampling and analysis for instrumented software
US11170016B2 (en) Navigating hierarchical components based on an expansion recommendation machine learning model
WO2019205717A1 (zh) 一种搜索应用程序内信息的方法及设备
JP2007183864A (ja) ファイル検索方法及びそのシステム
US10901811B2 (en) Creating alerts associated with a data storage system based on natural language requests
CN103955533B (zh) 一种基于缓冲队列的页面树形数据获取装置及方法
US20190034430A1 (en) Disambiguating a natural language request based on a disambiguation recommendation machine learning model
CN106844744B (zh) 点击模型应用方法、装置及搜索系统
CN110069378A (zh) 数据监控方法、装置、终端及计算机可读存储介质
CN114791846A (zh) 一种针对云原生混沌工程实验实现可观测性的方法
CN114846463A (zh) 可重复查询的识别和发布
CN111460333B (zh) 一种实时搜索数据分析系统
US20100153571A1 (en) Recording medium storing transaction model generation support program, transaction model generation support computer, and transaction model generation support method
CN115858893B (zh) 数据可视化分析方法、装置、电子设备及存储介质
CN108023740B (zh) 监控中异常信息的风险提示方法和装置
CN116226494B (zh) 一种用于信息搜索的爬虫系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant