CN116307407A

CN116307407A - 一种基于云计算的企业数据可视化处理系统及方法

Info

Publication number: CN116307407A
Application number: CN202310595853.3A
Authority: CN
Inventors: 宋楠
Original assignee: Beijing Mutual Time Technology Co ltd
Current assignee: Beijing Mutual Time Technology Co ltd
Priority date: 2023-05-25
Filing date: 2023-05-25
Publication date: 2023-06-23
Anticipated expiration: 2043-05-25
Also published as: CN116307407B

Abstract

本发明公开了一种基于云计算的企业数据可视化处理系统及方法，涉及企业数据可视化技术领域，通过预先获得由企业管理对企业数据分类为因素数据类型以及结果数据类型的结果，根据企业数据的分类结果以及预先收集的企业历史数据，分析结果数据类型与因素数据类型之间的数据依赖关系，并获得每个结果数据类型对应的展示依赖关系集合，进一步的实时收集企业数据，并基于展示依赖关系集合，向企业用户直观展示每个结果数据类型的影响趋势；智能分析因素和结果之间的依赖性，并进行直观的可视化展示，更有效的帮助企业管理人员进行决策，降低人工分析的人力成本，提高企业管理效率。

Description

一种基于云计算的企业数据可视化处理系统及方法

技术领域

本发明属于涉及企业数据可视化技术领域，具体是一种基于云计算的企业数据可视化处理系统及方法。

背景技术

在当前信息技术高度发达的时代，企业产生的数据量越来越庞大，数据处理与管理成为了企业管理过程中不可避免的重要问题。企业数据管理中的一项重要问题是数据依赖性的管理，需要根据各种因素来分析其如何影响企业重视的结果数据的，而这些企业数据在处理和分析过程中，各个因素之间的依赖性需要手动分析或者难以直观感受，因此往往需要消耗大量的时间和人力成本，效率低下，无法满足企业快速决策的需求。

为此，本发明提出一种基于云计算的企业数据可视化处理系统及方法。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。为此，本发明提出一种基于云计算的企业数据可视化处理系统及方法，该一种基于云计算的企业数据可视化处理系统及方法更有效的帮助企业管理人员进行决策，降低人工分析的人力成本，提高企业管理效率。

为实现上述目的，根据本发明的实施例1提出一种基于云计算的企业数据可视化处理系统，包括数据分类模块、数据关系分析模块以及企业数据可视化模块；其中，各个模块之间通过电气和/或无线网络方式连接；

其中，所述数据分类模块主要用于预先将企业数据分类为因素数据类型以及结果数据类型；

所述因素数据类型是指其变化会导致其他数据变化的数据类型；

所述结果数据类型是指会随着因素数据变化而变化的数据类型；

并将所有企业数据分类为因素数据类型以及结果数据类型的分类结果发送至云计算平台的数据关系收集模块；

其中，所述数据关系收集模块主要用于根据企业数据的分类结果以及预先收集的企业历史数据，分析结果数据类型与因素数据类型之间的数据依赖关系，并获得每个结果数据类型对应的展示依赖关系集合；

分析结果数据类型与因素数据类型之间的数据依赖关系，并获得每个结果数据类型对应的展示依赖关系集合的方式为：

所述数据关系收集模块预先收集由企业管理人员通过网络连接方式向云计算平台发送的各个结果数据类型的历史数据集合以及各个因素数据类型的历史数据集合，作为企业历史数据；结果数据类型的历史数据集合以及各个因素数据类型的历史数据集合均根据收集的时间具有时间对应关系，即在同一时间，收集到的因素数据类型和结果数据类型的历史数据作为一组历史数据；

基于因素数据类型的历史数据集合，获得因素数据类型对应的依赖关系集合；

获得因素数据类型对应的依赖关系集合的方式为：

将每个因素数据类型编号标记为i，将第i个因素数据类型的历史数据集合标记为Xi；

云计算平台使用分布式计算方式，对于每个因素数据类型编号标记为i，分布式的获取依赖关系集合

；

获取依赖关系集合

以下步骤：

步骤一：构造依赖关系集合

；从所有因素数据类型中随机选择其他两个因素数据类型，将该两个因素数据类型分别标记为i1和i2；并使用PCA主成成分分析技术对历史数据集合Xi、历史数据集合Xi1以及历史数据集合Xi2提取主成成分，以获取第i个因素数据类型、第i1个因素数据类型以及第i2个因素数据类型的依赖关系，若获得的属性数量小于3，则将依赖关系集合Pi更新为/>

；若获得的属性数量等于3，则循环执行步骤一，直至因素数据类型中无新的组合可选；需要说明的是，不重复是指若随机选择到已经随机选择过的组合，

步骤二：若

，则依赖关系集合/>

设置为空；若/>

,执行步骤三；

步骤三：将依赖关系集合

经过PCA主成成分分析后的属性数量标记为Ni，从所有因素数据类型中不重复的随机选择其他一个因素数据类型，将该因素数据类型标记为iu；使用PCA主成成分分析技术对历史数据集合Xiu，以及依赖关系集合Pi之中所有因素数据类型对应的历史数据集合进行主成成分提取；若获得的属性数量小于或等于Ni，则将因素数据类型iu补充至依赖关系集合Pi中；若获得的属性数量等于Ni+1，则不做处理；

循环步骤三，直至遍历完所有因素数据类型；

基于所有的依赖关系集合

收集依赖集合Q，其中依赖集合Q中的元素为依赖关系集合；

收集依赖集合Q的方式为：

遍历所有因素数据类型，对于第i个因素数据类型，若依赖关系集合Pi为空，则不做处理；

若依赖关系集合Pi不为空：

若依赖关系集合Pi在依赖集合Q中的最大重复度大于预设的重复度阈值，则将依赖关系集合Pi补充进依赖集合Q，若依赖关系集合Pi在依赖集合Q中的最大重复度小于预设的重复度阈值，不做处理；

其中，最大重复度为依赖集合Q中的所有依赖关系集合与依赖关系集合Pi的重复度中的最大值；

所述重复度的计算方式为：

；其中A和B分别为任意一个依赖关系集合，C为重复度；

基于结果数据类型与因素数据类型之间的数据依赖关系，获得因素数据类型与结果数据类型的依赖关系；

获得因素数据类型与结果数据类型的依赖关系的方式为：

将依赖集合Q中的每个依赖关系集合标记为q，将第q个依赖关系集合中的每个因素数据类型标记为jq；将第jq个因素数据类型的历史数据集合标记为Hjq；

将每个结果数据类型的编号标记为k；将第k个结果数据类型的历史数据集合标记为Hk；

云计算平台分布式的计算每个依赖关系集合和每个结果数据类型的依赖度；

计算每个依赖关系集合和每个结果数据类型的依赖度的方式为：

对于第q个依赖关系集合和第k个结果数据类型，将每个因素数据类型jq对应的历史数据集合Hjq以及结果数据类型对应的历史数据集合Hk划分为70%的依赖训练集以及30%的依赖测试集；

将依赖训练集中的历史数据集合Hjq作为机器学习模型的输入，该机器学习模型将预测的第k个结果数据类型的值作为输出，将训练集中的历史数据集合Hk作为预测目标，将预测准确率作为训练目标，对机器学习模型进行训练，直至预测准确率达到预设的第一准确率阈值；

将依赖测试集作为训练完成的机器学习模型的测试集，获得机器学习模型对于依赖测试集集的预测准确率，将依赖测试集的预测准确率作为第q个依赖关系集合对于第k个结果数据类型的依赖度，并将该依赖度标记为Zqk；

云计算平台基于每个依赖关系集合和每个结果数据类型的依赖度，获得每个结果数据类型的展示依赖关系集合；

对于第k个结果数据类型，所述展示依赖关系集合为所有依赖关系集合中依赖度Zqk最大的依赖关系集合，并将该展示依赖关系集合标记为Lk；

所述数据关系收集模块将每个结果数据类型对应的展示依赖关系集合发送至结果可视化模块；

其中，所述企业数据实时收集模块主要用于实时收集企业数据，并基于展示依赖关系集合，向企业用户直观展示每个结果数据类型的影响趋势；

向企业用户直观展示结果数据类型的影响趋势的方式为：

云计算平台实时获得由企业管理人员通过网络连接方式发送的各个结果数据类型的实时数据以及各个因素数据类型的实时数据；

对于第k个结果数据类型，预设历史展示时长，并将当前时刻之前的历史展示时长中，收集的第k个结果数据类型的所有数据，以及对应的展示依赖关系集合Lk中所有因素数据类型的所有数据，以时间趋势图的形式向企业用户展示。

根据本发明的实施例2提出一种基于云计算的企业数据可视化处理方法，包括以下步骤：

预先获得由企业管理对企业数据分类为因素数据类型以及结果数据类型的结果；

根据企业数据的分类结果以及预先收集的企业历史数据，分析结果数据类型与因素数据类型之间的数据依赖关系，并获得每个结果数据类型对应的展示依赖关系集合；

实时收集企业数据，并基于展示依赖关系集合，向企业用户直观展示每个结果数据类型的影响趋势。

与现有技术相比，本发明的有益效果是：

本发明通过预先获得由企业管理对企业数据分类为因素数据类型以及结果数据类型的结果，再收集企业历史数据，进一步的因素数据类型的企业历史数据分析各个因素数据类型之间的依赖关系，获得依赖集合，该依赖集合中的每个元素为依赖关系集合，每个依赖关系集合均代表一组具有相互依赖关系的因素数据类型，再基于依赖集合和企业历史数据，分析每组依赖关系集合与结果数据类型的依赖度，基于依赖度获得每个结果数据类型的展示依赖关系集合，最后基于展示依赖关系集合，以时间趋势图的形式向企业管理人员展示每个结果数据类型的影响趋势；自动的对企业数据进行依赖性进行关联分析，从庞杂的数据因素中智能查找到对企业有帮助的依赖关系，从而更有效的帮助企业管理人员进行决策，降低人工分析的人力成本，提高企业管理效率；

附图说明

图1为本发明实施例1中企业数据可视化处理系统的模块连接关系图；

图2为本发明实施例2中企业数据可视化处理方法的流程图。

具体实施方式

下面将结合实施例对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

如图1所示，一种基于云计算的企业数据可视化处理系统，包括数据分类模块、数据关系分析模块以及企业数据可视化模块；其中，各个模块之间通过电气和/或无线网络方式连接；

在一个优选的实施例中，所述因素数据类型是指其变化会导致其他数据变化的数据类型；例如：天气数据、上游材料供给数据以及下游客户需求数据等；

所述结果数据类型是指会随着因素数据变化而变化的数据类型；例如：实体店面中商品销售量等、成本数据以及库存数据等，因实体店面中商品销售量会受到天气数据影响，而产品生产的成本会受到上游材料供给量影响，而产品库存会受到下游客户需求量的影响；

需要说明的是，不同企业从事的行业不同，企业关注的数据类型也有所不同；云计算平台的数据关系收集模块预先接收由企业管理人员对所有企业数据进行分类的分类结果；

在一个优选的实施例中，分析结果数据类型与因素数据类型之间的数据依赖关系，并获得每个结果数据类型对应的展示依赖关系集合的方式为：

所述数据关系收集模块预先收集由企业管理人员通过网络连接方式向云计算平台发送的各个结果数据类型的历史数据集合以及各个因素数据类型的历史数据集合，作为企业历史数据；需要说明的是，结果数据类型的历史数据集合以及各个因素数据类型的历史数据集合均根据收集的时间具有时间对应关系，即在同一时间，收集到的因素数据类型和结果数据类型的历史数据作为一组历史数据；历史数据集合的一个例子是：历史中每次收集到的上游材料供给量作为历史数据集合；

获得因素数据类型对应的依赖关系集合的方式为：

；

获取依赖关系集合

以下步骤：

步骤一：构造依赖关系集合

；若获得的属性数量等于3，则重新不重复的随机选择其他两个因素数据类型；需要说明的是，不重复是指若随机选择到已经随机选择过的组合，则循环执行步骤一，直至因素数据类型中无新的组合可选；

步骤二：若

，则依赖关系集合/>

设置为空；若/>

,执行步骤三；

步骤三：将依赖关系集合

循环步骤三，直至遍历完所有因素数据类型；

基于所有的依赖关系集合

收集依赖集合Q，其中依赖集合Q中的元素为依赖关系集合；

收集依赖集合Q的方式为：

若依赖关系集合Pi不为空：

所述重复度的计算方式为：

；其中A和B分别为任意一个依赖关系集合，C为重复度；

在一个优选的实施例中，获得因素数据类型与结果数据类型的依赖关系的方式为：

将依赖测试集作为训练完成的机器学习模型的测试集，获得机器学习模型对于依赖测试集集的预测准确率，将依赖测试集的预测准确率作为第q个依赖关系集合对于第k个结果数据类型的依赖度，并将该依赖度标记为Zqk；可以理解的是，该依赖度越高，即对于依赖训练集的预测准确率越高，第k个结果数据类型对于将第q个依赖关系集合的依赖度越高，用第q个依赖关系集合来衡量第k个结果数据类型越准确；

在一个优选的实施例中，向企业用户直观展示结果数据类型的影响趋势的方式为：

对于第k个结果数据类型，预设历史展示时长，并将当前时刻之前的历史展示时长中，收集的第k个结果数据类型的所有数据，以及对应的展示依赖关系集合Lk中所有因素数据类型的所有数据，以时间趋势图的形式向企业用户展示；所述时间趋势图可以是折线图；可以理解的是，在时间趋势图中，第k个结果数据类型以及展示依赖关系集合Lk中的每个因素数据类型均使用一条折线表示，折线的横坐标为收集数据的时间，折线的纵坐标为结果数据类型以及因素数据类型在该收集数据时间对应的值；通过时间趋势图的方式，帮助企业用户更直观的观察各个因素之间的趋势关系。

如图2所示，一种基于云计算的企业数据可视化处理方法，包括以下步骤：

以上实施例仅用以说明本发明的技术方法而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方法进行修改或等同替换，而不脱离本发明技术方法的精神和范围。

Claims

1.一种基于云计算的企业数据可视化处理系统及方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于云计算的企业数据可视化处理系统及方法，其特征在于，所述因素数据类型是指其变化会导致其他数据变化的数据类型；

所述结果数据类型是指会随着因素数据变化而变化的数据类型。

3.根据权利要求1所述的一种基于云计算的企业数据可视化处理系统及方法，其特征在于，分析结果数据类型与因素数据类型之间的数据依赖关系，并获得每个结果数据类型对应的展示依赖关系集合的方式为：

预先收集由企业管理人员通过网络连接方式向云计算平台发送的各个结果数据类型的历史数据集合以及各个因素数据类型的历史数据集合，作为企业历史数据；结果数据类型的历史数据集合以及各个因素数据类型的历史数据集合根据收集的时间具有时间对应关系，即在同一时间，收集到的因素数据类型和结果数据类型的历史数据作为一组历史数据；

基于所有的依赖关系集合收集依赖集合，其中依赖集合中的元素为依赖关系集合；

计算依赖集合中的每个依赖关系集合和每个结果数据类型的依赖度；

云计算平台基于每个依赖关系集合和每个结果数据类型的依赖度，获得每个结果数据类型的展示依赖关系集合。

4.根据权利要求1所述的一种基于云计算的企业数据可视化处理系统及方法，其特征在于，获得因素数据类型对应的依赖关系集合的方式为：

获取依赖关系集合/>

以下步骤：

步骤一：构造依赖关系集合

步骤二：若

，则依赖关系集合/>

设置为空；若/>

,执行步骤三；

步骤三：将依赖关系集合

循环步骤三，直至遍历完所有因素数据类型。

5.根据权利要求1所述的一种基于云计算的企业数据可视化处理系统及方法，其特征在于，收集依赖集合Q的方式为：

若依赖关系集合Pi不为空：

所述重复度的计算方式为：

；其中A和B分别为任意一个依赖关系集合，C为重复度。

6.根据权利要求1所述的一种基于云计算的企业数据可视化处理系统及方法，其特征在于，计算依赖集合中的每个依赖关系集合和每个结果数据类型的依赖度的方式为：

将依赖测试集作为训练完成的机器学习模型的测试集，获得机器学习模型对于依赖测试集集的预测准确率，将依赖测试集的预测准确率作为第q个依赖关系集合对于第k个结果数据类型的依赖度，并将该依赖度标记为Zqk。

7.根据权利要求1所述的一种基于云计算的企业数据可视化处理系统及方法，其特征在于，对于第k个结果数据类型，所述展示依赖关系集合为所有依赖关系集合中依赖度Zqk最大的依赖关系集合。

8.根据权利要求1所述的一种基于云计算的企业数据可视化处理系统及方法，其特征在于，基于展示依赖关系集合，向企业用户直观展示每个结果数据类型的影响趋势的方式为：

对于第k个结果数据类型，预设历史展示时长，并将当前时刻之前的历史展示时长中，收集的第k个结果数据类型的所有数据，以及对应的展示依赖关系集合Lk中所有因素数据类型的所有数据，以时间趋势图的形式向企业用户展示；所述时间趋势图为折线图。

9.一种基于云计算的企业数据可视化处理系统，其基于权利要求1-8任意一项所述的一种基于云计算的企业数据可视化处理方法实现，其特征在于，包括数据分类模块、数据关系分析模块以及企业数据可视化模块；其中，各个模块之间通过电气和/或无线网络方式连接；

所述数据分类模块用于预先将企业数据分类为因素数据类型以及结果数据类型，并将所有企业数据分类为因素数据类型以及结果数据类型的分类结果发送至云计算平台的数据关系收集模块；

所述数据关系收集模块用于根据企业数据的分类结果以及预先收集的企业历史数据，分析结果数据类型与因素数据类型之间的数据依赖关系，并获得每个结果数据类型对应的展示依赖关系集合，并将每个结果数据类型对应的展示依赖关系集合发送至结果可视化模块；

所述企业数据实时收集模块用于实时收集企业数据，并基于展示依赖关系集合，向企业用户直观展示每个结果数据类型的影响趋势。