CN116307407A - 一种基于云计算的企业数据可视化处理系统及方法 - Google Patents

一种基于云计算的企业数据可视化处理系统及方法 Download PDF

Info

Publication number
CN116307407A
CN116307407A CN202310595853.3A CN202310595853A CN116307407A CN 116307407 A CN116307407 A CN 116307407A CN 202310595853 A CN202310595853 A CN 202310595853A CN 116307407 A CN116307407 A CN 116307407A
Authority
CN
China
Prior art keywords
data
dependency
data type
enterprise
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310595853.3A
Other languages
English (en)
Other versions
CN116307407B (zh
Inventor
宋楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Mutual Time Technology Co ltd
Original Assignee
Beijing Mutual Time Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mutual Time Technology Co ltd filed Critical Beijing Mutual Time Technology Co ltd
Priority to CN202310595853.3A priority Critical patent/CN116307407B/zh
Publication of CN116307407A publication Critical patent/CN116307407A/zh
Application granted granted Critical
Publication of CN116307407B publication Critical patent/CN116307407B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本发明公开了一种基于云计算的企业数据可视化处理系统及方法,涉及企业数据可视化技术领域,通过预先获得由企业管理对企业数据分类为因素数据类型以及结果数据类型的结果,根据企业数据的分类结果以及预先收集的企业历史数据,分析结果数据类型与因素数据类型之间的数据依赖关系,并获得每个结果数据类型对应的展示依赖关系集合,进一步的实时收集企业数据,并基于展示依赖关系集合,向企业用户直观展示每个结果数据类型的影响趋势;智能分析因素和结果之间的依赖性,并进行直观的可视化展示,更有效的帮助企业管理人员进行决策,降低人工分析的人力成本,提高企业管理效率。

Description

一种基于云计算的企业数据可视化处理系统及方法
技术领域
本发明属于涉及企业数据可视化技术领域,具体是一种基于云计算的企业数据可视化处理系统及方法。
背景技术
在当前信息技术高度发达的时代,企业产生的数据量越来越庞大,数据处理与管理成为了企业管理过程中不可避免的重要问题。企业数据管理中的一项重要问题是数据依赖性的管理,需要根据各种因素来分析其如何影响企业重视的结果数据的,而这些企业数据在处理和分析过程中,各个因素之间的依赖性需要手动分析或者难以直观感受,因此往往需要消耗大量的时间和人力成本,效率低下,无法满足企业快速决策的需求。
为此,本发明提出一种基于云计算的企业数据可视化处理系统及方法。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种基于云计算的企业数据可视化处理系统及方法,该一种基于云计算的企业数据可视化处理系统及方法更有效的帮助企业管理人员进行决策,降低人工分析的人力成本,提高企业管理效率。
为实现上述目的,根据本发明的实施例1提出一种基于云计算的企业数据可视化处理系统,包括数据分类模块、数据关系分析模块以及企业数据可视化模块;其中,各个模块之间通过电气和/或无线网络方式连接;
其中,所述数据分类模块主要用于预先将企业数据分类为因素数据类型以及结果数据类型;
所述因素数据类型是指其变化会导致其他数据变化的数据类型;
所述结果数据类型是指会随着因素数据变化而变化的数据类型;
并将所有企业数据分类为因素数据类型以及结果数据类型的分类结果发送至云计算平台的数据关系收集模块;
其中,所述数据关系收集模块主要用于根据企业数据的分类结果以及预先收集的企业历史数据,分析结果数据类型与因素数据类型之间的数据依赖关系,并获得每个结果数据类型对应的展示依赖关系集合;
分析结果数据类型与因素数据类型之间的数据依赖关系,并获得每个结果数据类型对应的展示依赖关系集合的方式为:
所述数据关系收集模块预先收集由企业管理人员通过网络连接方式向云计算平台发送的各个结果数据类型的历史数据集合以及各个因素数据类型的历史数据集合,作为企业历史数据;结果数据类型的历史数据集合以及各个因素数据类型的历史数据集合均根据收集的时间具有时间对应关系,即在同一时间,收集到的因素数据类型和结果数据类型的历史数据作为一组历史数据;
基于因素数据类型的历史数据集合,获得因素数据类型对应的依赖关系集合;
获得因素数据类型对应的依赖关系集合的方式为:
将每个因素数据类型编号标记为i,将第i个因素数据类型的历史数据集合标记为Xi;
云计算平台使用分布式计算方式,对于每个因素数据类型编号标记为i,分布式的获取依赖关系集合
Figure SMS_1
获取依赖关系集合
Figure SMS_2
以下步骤:
步骤一:构造依赖关系集合
Figure SMS_3
;从所有因素数据类型中随机选择其他两个因素数据类型,将该两个因素数据类型分别标记为i1和i2;并使用PCA主成成分分析技术对历史数据集合Xi、历史数据集合Xi1以及历史数据集合Xi2提取主成成分,以获取第i个因素数据类型、第i1个因素数据类型以及第i2个因素数据类型的依赖关系,若获得的属性数量小于3,则将依赖关系集合Pi更新为/>
Figure SMS_4
;若获得的属性数量等于3,则循环执行步骤一,直至因素数据类型中无新的组合可选;需要说明的是,不重复是指若随机选择到已经随机选择过的组合,
步骤二:若
Figure SMS_5
,则依赖关系集合/>
Figure SMS_6
设置为空;若/>
Figure SMS_7
,执行步骤三;
步骤三:将依赖关系集合
Figure SMS_8
经过PCA主成成分分析后的属性数量标记为Ni,从所有因素数据类型中不重复的随机选择其他一个因素数据类型,将该因素数据类型标记为iu;使用PCA主成成分分析技术对历史数据集合Xiu,以及依赖关系集合Pi之中所有因素数据类型对应的历史数据集合进行主成成分提取;若获得的属性数量小于或等于Ni,则将因素数据类型iu补充至依赖关系集合Pi中;若获得的属性数量等于Ni+1,则不做处理;
循环步骤三,直至遍历完所有因素数据类型;
基于所有的依赖关系集合
Figure SMS_9
收集依赖集合Q,其中依赖集合Q中的元素为依赖关系集合;
收集依赖集合Q的方式为:
遍历所有因素数据类型,对于第i个因素数据类型,若依赖关系集合Pi为空,则不做处理;
若依赖关系集合Pi不为空:
若依赖关系集合Pi在依赖集合Q中的最大重复度大于预设的重复度阈值,则将依赖关系集合Pi补充进依赖集合Q,若依赖关系集合Pi在依赖集合Q中的最大重复度小于预设的重复度阈值,不做处理;
其中,最大重复度为依赖集合Q中的所有依赖关系集合与依赖关系集合Pi的重复度中的最大值;
所述重复度的计算方式为:
Figure SMS_10
;其中A和B分别为任意一个依赖关系集合,C为重复度;
基于结果数据类型与因素数据类型之间的数据依赖关系,获得因素数据类型与结果数据类型的依赖关系;
获得因素数据类型与结果数据类型的依赖关系的方式为:
将依赖集合Q中的每个依赖关系集合标记为q,将第q个依赖关系集合中的每个因素数据类型标记为jq;将第jq个因素数据类型的历史数据集合标记为Hjq;
将每个结果数据类型的编号标记为k;将第k个结果数据类型的历史数据集合标记为Hk;
云计算平台分布式的计算每个依赖关系集合和每个结果数据类型的依赖度;
计算每个依赖关系集合和每个结果数据类型的依赖度的方式为:
对于第q个依赖关系集合和第k个结果数据类型,将每个因素数据类型jq对应的历史数据集合Hjq以及结果数据类型对应的历史数据集合Hk划分为70%的依赖训练集以及30%的依赖测试集;
将依赖训练集中的历史数据集合Hjq作为机器学习模型的输入,该机器学习模型将预测的第k个结果数据类型的值作为输出,将训练集中的历史数据集合Hk作为预测目标,将预测准确率作为训练目标,对机器学习模型进行训练,直至预测准确率达到预设的第一准确率阈值;
将依赖测试集作为训练完成的机器学习模型的测试集,获得机器学习模型对于依赖测试集集的预测准确率,将依赖测试集的预测准确率作为第q个依赖关系集合对于第k个结果数据类型的依赖度,并将该依赖度标记为Zqk;
云计算平台基于每个依赖关系集合和每个结果数据类型的依赖度,获得每个结果数据类型的展示依赖关系集合;
对于第k个结果数据类型,所述展示依赖关系集合为所有依赖关系集合中依赖度Zqk最大的依赖关系集合,并将该展示依赖关系集合标记为Lk;
所述数据关系收集模块将每个结果数据类型对应的展示依赖关系集合发送至结果可视化模块;
其中,所述企业数据实时收集模块主要用于实时收集企业数据,并基于展示依赖关系集合,向企业用户直观展示每个结果数据类型的影响趋势;
向企业用户直观展示结果数据类型的影响趋势的方式为:
云计算平台实时获得由企业管理人员通过网络连接方式发送的各个结果数据类型的实时数据以及各个因素数据类型的实时数据;
对于第k个结果数据类型,预设历史展示时长,并将当前时刻之前的历史展示时长中,收集的第k个结果数据类型的所有数据,以及对应的展示依赖关系集合Lk中所有因素数据类型的所有数据,以时间趋势图的形式向企业用户展示。
根据本发明的实施例2提出一种基于云计算的企业数据可视化处理方法,包括以下步骤:
预先获得由企业管理对企业数据分类为因素数据类型以及结果数据类型的结果;
根据企业数据的分类结果以及预先收集的企业历史数据,分析结果数据类型与因素数据类型之间的数据依赖关系,并获得每个结果数据类型对应的展示依赖关系集合;
实时收集企业数据,并基于展示依赖关系集合,向企业用户直观展示每个结果数据类型的影响趋势。
与现有技术相比,本发明的有益效果是:
本发明通过预先获得由企业管理对企业数据分类为因素数据类型以及结果数据类型的结果,再收集企业历史数据,进一步的因素数据类型的企业历史数据分析各个因素数据类型之间的依赖关系,获得依赖集合,该依赖集合中的每个元素为依赖关系集合,每个依赖关系集合均代表一组具有相互依赖关系的因素数据类型,再基于依赖集合和企业历史数据,分析每组依赖关系集合与结果数据类型的依赖度,基于依赖度获得每个结果数据类型的展示依赖关系集合,最后基于展示依赖关系集合,以时间趋势图的形式向企业管理人员展示每个结果数据类型的影响趋势;自动的对企业数据进行依赖性进行关联分析,从庞杂的数据因素中智能查找到对企业有帮助的依赖关系,从而更有效的帮助企业管理人员进行决策,降低人工分析的人力成本,提高企业管理效率;
附图说明
图1为本发明实施例1中企业数据可视化处理系统的模块连接关系图;
图2为本发明实施例2中企业数据可视化处理方法的流程图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,一种基于云计算的企业数据可视化处理系统,包括数据分类模块、数据关系分析模块以及企业数据可视化模块;其中,各个模块之间通过电气和/或无线网络方式连接;
其中,所述数据分类模块主要用于预先将企业数据分类为因素数据类型以及结果数据类型;
在一个优选的实施例中,所述因素数据类型是指其变化会导致其他数据变化的数据类型;例如:天气数据、上游材料供给数据以及下游客户需求数据等;
所述结果数据类型是指会随着因素数据变化而变化的数据类型;例如:实体店面中商品销售量等、成本数据以及库存数据等,因实体店面中商品销售量会受到天气数据影响,而产品生产的成本会受到上游材料供给量影响,而产品库存会受到下游客户需求量的影响;
需要说明的是,不同企业从事的行业不同,企业关注的数据类型也有所不同;云计算平台的数据关系收集模块预先接收由企业管理人员对所有企业数据进行分类的分类结果;
其中,所述数据关系收集模块主要用于根据企业数据的分类结果以及预先收集的企业历史数据,分析结果数据类型与因素数据类型之间的数据依赖关系,并获得每个结果数据类型对应的展示依赖关系集合;
在一个优选的实施例中,分析结果数据类型与因素数据类型之间的数据依赖关系,并获得每个结果数据类型对应的展示依赖关系集合的方式为:
所述数据关系收集模块预先收集由企业管理人员通过网络连接方式向云计算平台发送的各个结果数据类型的历史数据集合以及各个因素数据类型的历史数据集合,作为企业历史数据;需要说明的是,结果数据类型的历史数据集合以及各个因素数据类型的历史数据集合均根据收集的时间具有时间对应关系,即在同一时间,收集到的因素数据类型和结果数据类型的历史数据作为一组历史数据;历史数据集合的一个例子是:历史中每次收集到的上游材料供给量作为历史数据集合;
基于因素数据类型的历史数据集合,获得因素数据类型对应的依赖关系集合;
获得因素数据类型对应的依赖关系集合的方式为:
将每个因素数据类型编号标记为i,将第i个因素数据类型的历史数据集合标记为Xi;
云计算平台使用分布式计算方式,对于每个因素数据类型编号标记为i,分布式的获取依赖关系集合
Figure SMS_11
获取依赖关系集合
Figure SMS_12
以下步骤:
步骤一:构造依赖关系集合
Figure SMS_13
;从所有因素数据类型中随机选择其他两个因素数据类型,将该两个因素数据类型分别标记为i1和i2;并使用PCA主成成分分析技术对历史数据集合Xi、历史数据集合Xi1以及历史数据集合Xi2提取主成成分,以获取第i个因素数据类型、第i1个因素数据类型以及第i2个因素数据类型的依赖关系,若获得的属性数量小于3,则将依赖关系集合Pi更新为/>
Figure SMS_14
;若获得的属性数量等于3,则重新不重复的随机选择其他两个因素数据类型;需要说明的是,不重复是指若随机选择到已经随机选择过的组合,则循环执行步骤一,直至因素数据类型中无新的组合可选;
步骤二:若
Figure SMS_15
,则依赖关系集合/>
Figure SMS_16
设置为空;若/>
Figure SMS_17
,执行步骤三;
步骤三:将依赖关系集合
Figure SMS_18
经过PCA主成成分分析后的属性数量标记为Ni,从所有因素数据类型中不重复的随机选择其他一个因素数据类型,将该因素数据类型标记为iu;使用PCA主成成分分析技术对历史数据集合Xiu,以及依赖关系集合Pi之中所有因素数据类型对应的历史数据集合进行主成成分提取;若获得的属性数量小于或等于Ni,则将因素数据类型iu补充至依赖关系集合Pi中;若获得的属性数量等于Ni+1,则不做处理;
循环步骤三,直至遍历完所有因素数据类型;
基于所有的依赖关系集合
Figure SMS_19
收集依赖集合Q,其中依赖集合Q中的元素为依赖关系集合;
收集依赖集合Q的方式为:
遍历所有因素数据类型,对于第i个因素数据类型,若依赖关系集合Pi为空,则不做处理;
若依赖关系集合Pi不为空:
若依赖关系集合Pi在依赖集合Q中的最大重复度大于预设的重复度阈值,则将依赖关系集合Pi补充进依赖集合Q,若依赖关系集合Pi在依赖集合Q中的最大重复度小于预设的重复度阈值,不做处理;
其中,最大重复度为依赖集合Q中的所有依赖关系集合与依赖关系集合Pi的重复度中的最大值;
所述重复度的计算方式为:
Figure SMS_20
;其中A和B分别为任意一个依赖关系集合,C为重复度;
基于结果数据类型与因素数据类型之间的数据依赖关系,获得因素数据类型与结果数据类型的依赖关系;
在一个优选的实施例中,获得因素数据类型与结果数据类型的依赖关系的方式为:
将依赖集合Q中的每个依赖关系集合标记为q,将第q个依赖关系集合中的每个因素数据类型标记为jq;将第jq个因素数据类型的历史数据集合标记为Hjq;
将每个结果数据类型的编号标记为k;将第k个结果数据类型的历史数据集合标记为Hk;
云计算平台分布式的计算每个依赖关系集合和每个结果数据类型的依赖度;
计算每个依赖关系集合和每个结果数据类型的依赖度的方式为:
对于第q个依赖关系集合和第k个结果数据类型,将每个因素数据类型jq对应的历史数据集合Hjq以及结果数据类型对应的历史数据集合Hk划分为70%的依赖训练集以及30%的依赖测试集;
将依赖训练集中的历史数据集合Hjq作为机器学习模型的输入,该机器学习模型将预测的第k个结果数据类型的值作为输出,将训练集中的历史数据集合Hk作为预测目标,将预测准确率作为训练目标,对机器学习模型进行训练,直至预测准确率达到预设的第一准确率阈值;
将依赖测试集作为训练完成的机器学习模型的测试集,获得机器学习模型对于依赖测试集集的预测准确率,将依赖测试集的预测准确率作为第q个依赖关系集合对于第k个结果数据类型的依赖度,并将该依赖度标记为Zqk;可以理解的是,该依赖度越高,即对于依赖训练集的预测准确率越高,第k个结果数据类型对于将第q个依赖关系集合的依赖度越高,用第q个依赖关系集合来衡量第k个结果数据类型越准确;
云计算平台基于每个依赖关系集合和每个结果数据类型的依赖度,获得每个结果数据类型的展示依赖关系集合;
对于第k个结果数据类型,所述展示依赖关系集合为所有依赖关系集合中依赖度Zqk最大的依赖关系集合,并将该展示依赖关系集合标记为Lk;
所述数据关系收集模块将每个结果数据类型对应的展示依赖关系集合发送至结果可视化模块;
其中,所述企业数据实时收集模块主要用于实时收集企业数据,并基于展示依赖关系集合,向企业用户直观展示每个结果数据类型的影响趋势;
在一个优选的实施例中,向企业用户直观展示结果数据类型的影响趋势的方式为:
云计算平台实时获得由企业管理人员通过网络连接方式发送的各个结果数据类型的实时数据以及各个因素数据类型的实时数据;
对于第k个结果数据类型,预设历史展示时长,并将当前时刻之前的历史展示时长中,收集的第k个结果数据类型的所有数据,以及对应的展示依赖关系集合Lk中所有因素数据类型的所有数据,以时间趋势图的形式向企业用户展示;所述时间趋势图可以是折线图;可以理解的是,在时间趋势图中,第k个结果数据类型以及展示依赖关系集合Lk中的每个因素数据类型均使用一条折线表示,折线的横坐标为收集数据的时间,折线的纵坐标为结果数据类型以及因素数据类型在该收集数据时间对应的值;通过时间趋势图的方式,帮助企业用户更直观的观察各个因素之间的趋势关系。
如图2所示,一种基于云计算的企业数据可视化处理方法,包括以下步骤:
预先获得由企业管理对企业数据分类为因素数据类型以及结果数据类型的结果;
根据企业数据的分类结果以及预先收集的企业历史数据,分析结果数据类型与因素数据类型之间的数据依赖关系,并获得每个结果数据类型对应的展示依赖关系集合;
实时收集企业数据,并基于展示依赖关系集合,向企业用户直观展示每个结果数据类型的影响趋势。
以上实施例仅用以说明本发明的技术方法而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方法进行修改或等同替换,而不脱离本发明技术方法的精神和范围。

Claims (9)

1.一种基于云计算的企业数据可视化处理系统及方法,其特征在于,包括以下步骤:
预先获得由企业管理对企业数据分类为因素数据类型以及结果数据类型的结果;
根据企业数据的分类结果以及预先收集的企业历史数据,分析结果数据类型与因素数据类型之间的数据依赖关系,并获得每个结果数据类型对应的展示依赖关系集合;
实时收集企业数据,并基于展示依赖关系集合,向企业用户直观展示每个结果数据类型的影响趋势。
2.根据权利要求1所述的一种基于云计算的企业数据可视化处理系统及方法,其特征在于,所述因素数据类型是指其变化会导致其他数据变化的数据类型;
所述结果数据类型是指会随着因素数据变化而变化的数据类型。
3.根据权利要求1所述的一种基于云计算的企业数据可视化处理系统及方法,其特征在于,分析结果数据类型与因素数据类型之间的数据依赖关系,并获得每个结果数据类型对应的展示依赖关系集合的方式为:
预先收集由企业管理人员通过网络连接方式向云计算平台发送的各个结果数据类型的历史数据集合以及各个因素数据类型的历史数据集合,作为企业历史数据;结果数据类型的历史数据集合以及各个因素数据类型的历史数据集合根据收集的时间具有时间对应关系,即在同一时间,收集到的因素数据类型和结果数据类型的历史数据作为一组历史数据;
基于因素数据类型的历史数据集合,获得因素数据类型对应的依赖关系集合;
基于所有的依赖关系集合收集依赖集合,其中依赖集合中的元素为依赖关系集合;
计算依赖集合中的每个依赖关系集合和每个结果数据类型的依赖度;
云计算平台基于每个依赖关系集合和每个结果数据类型的依赖度,获得每个结果数据类型的展示依赖关系集合。
4.根据权利要求1所述的一种基于云计算的企业数据可视化处理系统及方法,其特征在于,获得因素数据类型对应的依赖关系集合的方式为:
将每个因素数据类型编号标记为i,将第i个因素数据类型的历史数据集合标记为Xi;
云计算平台使用分布式计算方式,对于每个因素数据类型编号标记为i,分布式的获取依赖关系集合
Figure QLYQS_1
获取依赖关系集合/>
Figure QLYQS_2
以下步骤:
步骤一:构造依赖关系集合
Figure QLYQS_3
;从所有因素数据类型中随机选择其他两个因素数据类型,将该两个因素数据类型分别标记为i1和i2;并使用PCA主成成分分析技术对历史数据集合Xi、历史数据集合Xi1以及历史数据集合Xi2提取主成成分,以获取第i个因素数据类型、第i1个因素数据类型以及第i2个因素数据类型的依赖关系,若获得的属性数量小于3,则将依赖关系集合Pi更新为/>
Figure QLYQS_4
;若获得的属性数量等于3,则循环执行步骤一,直至因素数据类型中无新的组合可选;需要说明的是,不重复是指若随机选择到已经随机选择过的组合,
步骤二:若
Figure QLYQS_5
,则依赖关系集合/>
Figure QLYQS_6
设置为空;若/>
Figure QLYQS_7
,执行步骤三;
步骤三:将依赖关系集合
Figure QLYQS_8
经过PCA主成成分分析后的属性数量标记为Ni,从所有因素数据类型中不重复的随机选择其他一个因素数据类型,将该因素数据类型标记为iu;使用PCA主成成分分析技术对历史数据集合Xiu,以及依赖关系集合Pi之中所有因素数据类型对应的历史数据集合进行主成成分提取;若获得的属性数量小于或等于Ni,则将因素数据类型iu补充至依赖关系集合Pi中;若获得的属性数量等于Ni+1,则不做处理;
循环步骤三,直至遍历完所有因素数据类型。
5.根据权利要求1所述的一种基于云计算的企业数据可视化处理系统及方法,其特征在于,收集依赖集合Q的方式为:
遍历所有因素数据类型,对于第i个因素数据类型,若依赖关系集合Pi为空,则不做处理;
若依赖关系集合Pi不为空:
若依赖关系集合Pi在依赖集合Q中的最大重复度大于预设的重复度阈值,则将依赖关系集合Pi补充进依赖集合Q,若依赖关系集合Pi在依赖集合Q中的最大重复度小于预设的重复度阈值,不做处理;
其中,最大重复度为依赖集合Q中的所有依赖关系集合与依赖关系集合Pi的重复度中的最大值;
所述重复度的计算方式为:
Figure QLYQS_9
;其中A和B分别为任意一个依赖关系集合,C为重复度。
6.根据权利要求1所述的一种基于云计算的企业数据可视化处理系统及方法,其特征在于,计算依赖集合中的每个依赖关系集合和每个结果数据类型的依赖度的方式为:
将依赖集合Q中的每个依赖关系集合标记为q,将第q个依赖关系集合中的每个因素数据类型标记为jq;将第jq个因素数据类型的历史数据集合标记为Hjq;
将每个结果数据类型的编号标记为k;将第k个结果数据类型的历史数据集合标记为Hk;
对于第q个依赖关系集合和第k个结果数据类型,将每个因素数据类型jq对应的历史数据集合Hjq以及结果数据类型对应的历史数据集合Hk划分为70%的依赖训练集以及30%的依赖测试集;
将依赖训练集中的历史数据集合Hjq作为机器学习模型的输入,该机器学习模型将预测的第k个结果数据类型的值作为输出,将训练集中的历史数据集合Hk作为预测目标,将预测准确率作为训练目标,对机器学习模型进行训练,直至预测准确率达到预设的第一准确率阈值;
将依赖测试集作为训练完成的机器学习模型的测试集,获得机器学习模型对于依赖测试集集的预测准确率,将依赖测试集的预测准确率作为第q个依赖关系集合对于第k个结果数据类型的依赖度,并将该依赖度标记为Zqk。
7.根据权利要求1所述的一种基于云计算的企业数据可视化处理系统及方法,其特征在于,对于第k个结果数据类型,所述展示依赖关系集合为所有依赖关系集合中依赖度Zqk最大的依赖关系集合。
8.根据权利要求1所述的一种基于云计算的企业数据可视化处理系统及方法,其特征在于,基于展示依赖关系集合,向企业用户直观展示每个结果数据类型的影响趋势的方式为:
云计算平台实时获得由企业管理人员通过网络连接方式发送的各个结果数据类型的实时数据以及各个因素数据类型的实时数据;
对于第k个结果数据类型,预设历史展示时长,并将当前时刻之前的历史展示时长中,收集的第k个结果数据类型的所有数据,以及对应的展示依赖关系集合Lk中所有因素数据类型的所有数据,以时间趋势图的形式向企业用户展示;所述时间趋势图为折线图。
9.一种基于云计算的企业数据可视化处理系统,其基于权利要求1-8任意一项所述的一种基于云计算的企业数据可视化处理方法实现,其特征在于,包括数据分类模块、数据关系分析模块以及企业数据可视化模块;其中,各个模块之间通过电气和/或无线网络方式连接;
所述数据分类模块用于预先将企业数据分类为因素数据类型以及结果数据类型,并将所有企业数据分类为因素数据类型以及结果数据类型的分类结果发送至云计算平台的数据关系收集模块;
所述数据关系收集模块用于根据企业数据的分类结果以及预先收集的企业历史数据,分析结果数据类型与因素数据类型之间的数据依赖关系,并获得每个结果数据类型对应的展示依赖关系集合,并将每个结果数据类型对应的展示依赖关系集合发送至结果可视化模块;
所述企业数据实时收集模块用于实时收集企业数据,并基于展示依赖关系集合,向企业用户直观展示每个结果数据类型的影响趋势。
CN202310595853.3A 2023-05-25 2023-05-25 一种基于云计算的企业数据可视化处理系统及方法 Active CN116307407B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310595853.3A CN116307407B (zh) 2023-05-25 2023-05-25 一种基于云计算的企业数据可视化处理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310595853.3A CN116307407B (zh) 2023-05-25 2023-05-25 一种基于云计算的企业数据可视化处理系统及方法

Publications (2)

Publication Number Publication Date
CN116307407A true CN116307407A (zh) 2023-06-23
CN116307407B CN116307407B (zh) 2023-08-11

Family

ID=86829124

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310595853.3A Active CN116307407B (zh) 2023-05-25 2023-05-25 一种基于云计算的企业数据可视化处理系统及方法

Country Status (1)

Country Link
CN (1) CN116307407B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7702615B1 (en) * 2005-11-04 2010-04-20 M-Factor, Inc. Creation and aggregation of predicted data
CN107563705A (zh) * 2017-09-25 2018-01-09 四川长虹电器股份有限公司 利用大数据分析家电产品安全库存及再订货的系统和方法
CN108038583A (zh) * 2016-10-28 2018-05-15 开利公司 用于管理绩效指标以解决企业设施运营管理目标的方法和系统
CN111260206A (zh) * 2020-01-14 2020-06-09 中国计量大学 一种光伏发电影响因素评价模型、构建方法及应用
CN113191730A (zh) * 2021-04-30 2021-07-30 中国安全生产科学研究院 一种基于大数据的危险化学品全生命周期信息监管系统
CN113985853A (zh) * 2021-11-01 2022-01-28 浙江大学 一种基于数据依赖核判别分析的工业过程可视化监控方法
CN114416855A (zh) * 2021-12-14 2022-04-29 国网河北省电力有限公司经济技术研究院 一种基于电力大数据的可视化平台及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7702615B1 (en) * 2005-11-04 2010-04-20 M-Factor, Inc. Creation and aggregation of predicted data
CN108038583A (zh) * 2016-10-28 2018-05-15 开利公司 用于管理绩效指标以解决企业设施运营管理目标的方法和系统
CN107563705A (zh) * 2017-09-25 2018-01-09 四川长虹电器股份有限公司 利用大数据分析家电产品安全库存及再订货的系统和方法
CN111260206A (zh) * 2020-01-14 2020-06-09 中国计量大学 一种光伏发电影响因素评价模型、构建方法及应用
CN113191730A (zh) * 2021-04-30 2021-07-30 中国安全生产科学研究院 一种基于大数据的危险化学品全生命周期信息监管系统
CN113985853A (zh) * 2021-11-01 2022-01-28 浙江大学 一种基于数据依赖核判别分析的工业过程可视化监控方法
CN114416855A (zh) * 2021-12-14 2022-04-29 国网河北省电力有限公司经济技术研究院 一种基于电力大数据的可视化平台及方法

Also Published As

Publication number Publication date
CN116307407B (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
CN106779505B (zh) 一种基于大数据驱动的输电线路故障预警方法及系统
WO2018132840A1 (en) Methods of assessing long-term indicators of sentiment
CN107368700A (zh) 基于计算云平台的微生物多样性交互分析系统及其方法
US20190236497A1 (en) System and method for automated model selection for key performance indicator forecasting
CN113065101B (zh) 逻辑回归模型的可视化解释方法及装置
CN109727446A (zh) 一种用电数据异常值的识别与处理方法
CN110009502B (zh) 理财数据分析方法、装置、计算机设备和存储介质
EP3267385A1 (en) Data pre-processing and searching systems
CN110796159A (zh) 基于k-means算法的电力数据分类方法及系统
EP1672578A1 (en) Method and system for analyzing the risk of a project
CN115689415A (zh) 一种基于数字孪生的物流监视与仿真系统
CN113268403A (zh) 时间序列的分析预测方法、装置、设备及存储介质
CN114881167A (zh) 异常检测方法、装置、电子设备和介质
CN103268329B (zh) 等离子显示屏制造过程数据挖掘系统
CN116307407B (zh) 一种基于云计算的企业数据可视化处理系统及方法
CN111177495A (zh) 一种智能识别数据内容并生成相应行业报告的方法
CN110874640A (zh) 使用机器学习(ml)的间歇数据的分布选择和模拟
WO2016187504A1 (en) Crowd-based sentiment indices
CN115169426B (zh) 一种基于相似性学习融合模型的异常检测方法及系统
CN114969169A (zh) 签收数据监控方法、装置、设备及存储介质
CN109189775B (zh) 一种工业监控平台海量数据处理系统及方法
CN114586025A (zh) 分析装置、控制方法和程序
CN111339410A (zh) 一种基于大数据的网络安全产品销售系统
CN112488410A (zh) 基于设备综合效率的生产设备性能优化方法及装置
CN111612302A (zh) 一种集团级数据管理方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant