CN118132643A - 一种工业物联网数据可视化发布方法 - Google Patents
一种工业物联网数据可视化发布方法 Download PDFInfo
- Publication number
- CN118132643A CN118132643A CN202410299153.4A CN202410299153A CN118132643A CN 118132643 A CN118132643 A CN 118132643A CN 202410299153 A CN202410299153 A CN 202410299153A CN 118132643 A CN118132643 A CN 118132643A
- Authority
- CN
- China
- Prior art keywords
- data
- analysis
- preprocessing
- image
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 230000000007 visual effect Effects 0.000 title claims abstract description 40
- 238000007781 pre-processing Methods 0.000 claims abstract description 45
- 238000004458 analytical method Methods 0.000 claims abstract description 27
- 238000007405 data analysis Methods 0.000 claims abstract description 26
- 238000013145 classification model Methods 0.000 claims abstract description 14
- 238000003860 storage Methods 0.000 claims abstract description 11
- 230000011218 segmentation Effects 0.000 claims abstract description 10
- 238000013500 data storage Methods 0.000 claims abstract description 8
- 238000012800 visualization Methods 0.000 claims abstract description 7
- 238000003745 diagnosis Methods 0.000 claims abstract description 5
- 238000006243 chemical reaction Methods 0.000 claims abstract description 4
- 238000013434 data augmentation Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims abstract description 4
- 238000012545 processing Methods 0.000 claims description 37
- 230000001932 seasonal effect Effects 0.000 claims description 31
- 238000007500 overflow downdraw method Methods 0.000 claims description 23
- 230000004927 fusion Effects 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 19
- 238000009499 grossing Methods 0.000 claims description 17
- 238000004422 calculation algorithm Methods 0.000 claims description 14
- 238000007619 statistical method Methods 0.000 claims description 13
- 238000010219 correlation analysis Methods 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 7
- 238000010801 machine learning Methods 0.000 claims description 7
- 238000000611 regression analysis Methods 0.000 claims description 7
- 238000000546 chi-square test Methods 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 claims description 6
- 238000003709 image segmentation Methods 0.000 claims description 6
- 238000005065 mining Methods 0.000 claims description 6
- 238000013135 deep learning Methods 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000003708 edge detection Methods 0.000 claims description 4
- 238000003491 array Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000007621 cluster analysis Methods 0.000 claims description 3
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims description 3
- 238000003058 natural language processing Methods 0.000 claims description 3
- 230000000737 periodic effect Effects 0.000 claims description 3
- 238000013079 data visualisation Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
- G06F16/168—Details of user interfaces specifically adapted to file systems, e.g. browsing and visualisation, 2d or 3d GUIs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2428—Query predicate definition using graphical user interfaces, including menus and forms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/259—Fusion by voting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2123/00—Data types
- G06F2123/02—Data types in the time domain, e.g. time-series data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Human Resources & Organizations (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Human Computer Interaction (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Fuzzy Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种工业物联网数据可视化发布方法,涉及数据分析技术领域,设计了一个可视化数据分析平台辅助,可视化数据分析平台包括前端模块、数据预处理模块、数据分析模块和数据存储模块;前端模块包括数据预处理、数据分析及结果可视化及模型下载三个功能;数据预处理模块为训练或待分析数据提供分词、格式转换和数据增广预处理方法;数据分析模块调用诊断模型对预处理完毕的数据进行类别判断,并返回结果;数据存储模块包括文件存储和数据库存储;具体包括,S1:对数据的预处理;S2:对数据进行分类模型的构建;S3:对数据的融合;S4:实现可视化平台对所述数据进行分析可视化发布数据;本发明通过以上步骤实现了分析结果的可视化。
Description
技术领域
本发明涉及数据分析技术领域,尤其是涉及一种工业物联网数据可视化发布方法。
背景技术
基于工业物联网数据可视化的数据发布方法背景源于对工业数据的更好利用和共享的需求。随着工业物联网技术的发展,大量的工业数据被采集和生成,包括设备状态、生产指标、能源消耗等。这些数据包含着有价值的信息,可以帮助企业进行生产优化、故障预测和决策支持。然而,传统的数据呈现方式如报表和图表往往难以满足快速、直观和全面理解数据的需求。
因此,有必要提供一种工业物联网数据可视化发布方法,来解决上述问题。
发明内容
本发明的目的是提供一种工业物联网数据可视化发布方法,对数据采用数据融合技术和可视化分析技术,建立统一整合的可视化平台,全面深入分析各类数据,从而可以快速高效的获取到想要的信息。
为实现上述目的,本发明提供了一种工业物联网数据可视化发布方法,设计了一个可视化数据分析平台来辅助进行数据分析,可视化数据分析平台包括前端模块、数据预处理模块、数据分析模块和数据存储模块;
前端模块包括数据预处理、数据分析及结果可视化及模型下载三个功能;
数据预处理模块为训练或待分析数据提供分词、格式转换和数据增广预处理方法;
数据分析模块调用诊断模型对预处理完毕的数据进行类别判断,并返回结果;
数据存储模块包括文件存储和数据库存储,文件存储是将占用资源较大的系统模型或用户数据以文件的形式存储;
具体包括以下步骤:
S1:对工业物联网数据的预处理;
S2:对工业物联网数据进行分类模型的构建;
S3:对工业物联网数据的融合;
S4:实现可视化平台对所述工业物联网数据进行分析可视化发布。
优选的,在步骤S1中,不同数据类型的预处理方式不同;
处理数值型数据时,使用缺失值处理、异常值处理和数据平滑的预处理方式;
缺失值处理:填充缺失值,使用均值、中位数、众数进行填充,或使用插值方法进行估算;
异常值处理:检测和处理异常值,使用统计方法:基于标准差的方法或箱线图方法;
数据平滑:对数据进行平滑处理,移动平均或指数平滑,减少噪声;
处理分类型数据时,使用哑变量编码和标签编码的预处理方式;
哑变量编码:将分类变量转换为二进制的哑变量;
标签编码:将分类变量编码为整数标签,在算法中使用;
处理文本数据时,使用文本清洗、分词和词干提取和停用词移除的预处理方式;
使用文本清洗:去除特殊字符、标点符号和转换为小写字母;
分词和词干提取:将文本拆分为单词或标记并提取词干;
停用词移除:去除常见的无意义词语;
处理时间序列数据时,使用时间戳处理、时间间隔计算和季节性调整的预处理方式;
时间戳处理:将时间戳转换为适当的时间格式,年-月-日或年-月-日-时-分-秒;
时间间隔计算:计算时间之间的间隔、差异或滞后;
季节性调整:对季节性数据进行季节性调整,消除季节效应;
处理图像数据时,使用图像缩放和裁剪、图像增强和特征提取的预处理方式;
图像缩放和裁剪:调整图像的大小和比例,适应特定的分析需求;
图像增强:增加对比度、调整亮度,增强图像特征;
特征提取:使用计算机视觉技术从图像中提取特征,包括边缘检测、颜色直方图;
根据具体数据集和分析任务的要求进行选择和组合预处理方法。
优选的,在步骤S2中,数据为数值型数据时,使用描述统计分析、相关性分析和回归分析;
采用描述统计分析:计算数据的均值、中位数和标准差统计指标,了解数据的分布和集中趋势;相关性分析:通过计算相关系数来评估数值变量之间的相关性;回归分析:建立数值型变量之间的回归模型,探索变量之间的线性关系;
数据为分类型数据时,使用频数统计和占比、卡方检验和分类模型;
频数统计和占比:计算每个类别的频数和占比,了解不同类别的分布情况;卡方检验:用于比较两个或多个分类变量之间的关联性和独立性;分类模型:使用机器学习算法建立分类模型,预测或分类新的数据;
数据为文本数据时,使用文本挖掘、文本聚类和文本分类;
文本挖掘:使用自然语言处理技术,从文本数据中提取有价值的信息;文本聚类:将文本数据进行聚类分析,将具有相似主题或内容的文本归为一类;文本分类:使用机器学习算法,将文本数据进行分类;
数据为时间序列数据时,使用时间序列分解、时间序列模型和季节性分析;
时间序列分解:将时间序列数据分解为趋势、季节性和残差成分,来了解数据的结构和特征;时间序列模型:使用ARIMA和指数平滑建立时间序列模型,进行未来值的预测和趋势分析;季节性分析:检测和分析时间序列数据中的季节性模式和周期性变动;
数据为图像数据时,使用特征提取、图像分类和识别和图像分割;
特征提取:使用计算机视觉技术从图像中提取特征;图像分类和识别:使用深度学习算法,对图像进行分类和识别;图像分割:将图像分割为不同的区域或对象。
优选的,在步骤S3中,采用决策级融合策略设计了投票法和权重法两种融合方法,实现多模块数据的融合,决策级融合策略投票融合法或权重融合法;
投票融合法具体包括如下过程:
将各个子模型的决策值作为类别标签进行统计,每个类别标签为一票,以多数表决法获得的得票最高类别作为最终结论输出;
权重融合法具体包括如下过程:
将各个子模型的决策值按照类别对齐后转换并拼接为决策矩阵,使用决策矩阵与权重数组的对应元素相乘,并按列对加权后的各类别概率进行求和,将概率最大的类别作为最终结论输出。
因此,本发明采用上述一种工业物联网数据可视化发布方法,具备以下
有益效果:
(1)本发明提供直观的数据理解,数据可视化通过图表、图形和可视化界面等方式,将数据转化为可直观理解的形式。这使用户能够更容易地理解数据的含义、趋势和关系,无需深入了解复杂的数据结构和统计分析方法。
(2)本发明加强数据的发现和洞察,数据可视化方法系统帮助用户发现数据中的隐藏模式、趋势和异常;通过交互式的可视化界面,用户可以针对不同方面进行探索,对数据进行筛选、过滤和切片,并观察数据的变化。这有助于揭示数据中的关联性和规律,发现新的见解和洞察。
(3)本发明支持实时和动态数据分析,数据可视化方法系统能够处理实时和动态数据源,使用户能够实时监测数据的变化和趋势;通过动态更新和交互式的可视化图表,用户可以随时了解数据的最新状态,及时做出决策和调整。
(4)本发明促进跨数据源的综合分析,数据可视化方法系统可以集成多个数据源的数据,并将其集中展示和分析。这有助于用户在一个统一的界面中综合分析不同数据源的数据,发现数据之间的关联性和相互影响,通过数据集中接入和综合分析,用户可以获得更全面、准确的数据视图和洞察。
(5)本发明改进决策制定和战略规划,数据可视化方法系统提供了决策制定和战略规划的重要支持。通过可视化的数据展示和分析,决策者可以更好地理解当前情况和趋势,基于数据驱动的洞察做出明智的决策。数据可视化还可以帮助识别问题、评估方案效果并进行预测,从而优化决策制定和战略规划的过程。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1是本发明一种工业物联网数据可视化发布方法的流程图;
图2是本发明基于工业物联网数据可视化的数据发布方法的流程示意图;
图3是本发明实施例相对多数表决法的代码图;
图4是本发明实施例权重法的伪代码图;
具体实施方式
以下通过附图和实施例对本发明的技术方案作进一步说明。
除非另外定义,本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。
本发明中使用的“包括”或者“包含”等类似的词语意指在该词前的要素涵盖在该词后列举的要素,并不排除也涵盖其它要素的可能。术语“内”、“外”、“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。在本发明中,除非另有明确的规定和限定,术语“附着”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
如图1所示,本发明提供了一种工业物联网数据可视化发布方法,设计了一个可视化数据分析平台来辅助进行数据分析,可视化数据分析平台包括前端模块、数据预处理模块、数据分析模块和数据存储模块;
前端模块包括数据预处理、数据分析及结果可视化及模型下载三个功能;
数据预处理模块为训练或待分析数据提供分词、格式转换和数据增广预处理方法;
数据分析模块调用诊断模型对预处理完毕的数据进行类别判断,并返回结果;
数据存储模块包括文件存储和数据库存储,文件存储是将占用资源较大的系统模型或用户数据以文件的形式存储;
如图2所示,具体包括以下步骤:
S1:对工业物联网数据的预处理;在步骤S1中,不同数据类型的预处理方式不同;
处理数值型数据时,使用缺失值处理、异常值处理和数据平滑的预处理方式;
缺失值处理:填充缺失值,使用均值、中位数、众数进行填充,或使用插值方法进行估算;
异常值处理:检测和处理异常值,使用统计方法:基于标准差的方法或箱线图方法;
数据平滑:对数据进行平滑处理,移动平均或指数平滑,减少噪声;
处理分类型数据时,使用哑变量编码和标签编码的预处理方式;
哑变量编码:将分类变量转换为二进制的哑变量(0和1);
标签编码:将分类变量编码为整数标签,在算法中使用;
处理文本数据时,使用文本清洗、分词和词干提取和停用词移除的预处理方式;
使用文本清洗:去除特殊字符、标点符号和转换为小写字母;
分词和词干提取:将文本拆分为单词或标记并提取词干;
停用词移除:去除常见的无意义词语;
处理时间序列数据时,使用时间戳处理、时间间隔计算和季节性调整的预处理方式;
时间戳处理:将时间戳转换为适当的时间格式,年-月-日或年-月-日-时-分-秒;
时间间隔计算:计算时间之间的间隔、差异或滞后;
季节性调整:对季节性数据进行季节性调整,消除季节效应;
处理图像数据时,使用图像缩放和裁剪、图像增强和特征提取的预处理方式;
图像缩放和裁剪:调整图像的大小和比例,适应特定的分析需求;
图像增强:增加对比度、调整亮度,增强图像特征;
特征提取:使用计算机视觉技术从图像中提取特征,包括边缘检测、颜色直方图;
根据具体数据集和分析任务的要求进行选择和组合预处理方法。
S2:对工业物联网数据进行分类模型的构建;在步骤S2中,数据为数值型数据时,使用描述统计分析、相关性分析和回归分析;
采用描述统计分析:计算数据的均值、中位数和标准差统计指标,了解数据的分布和集中趋势;相关性分析:通过计算相关系数来评估数值变量之间的相关性;回归分析:建立数值型变量之间的回归模型,探索变量之间的线性关系;
数据为分类型数据时,使用频数统计和占比、卡方检验和分类模型;
频数统计和占比:计算每个类别的频数和占比,了解不同类别的分布情况;卡方检验:用于比较两个或多个分类变量之间的关联性和独立性;分类模型:使用机器学习算法建立分类模型,预测或分类新的数据;
数据为文本数据时,使用文本挖掘、文本聚类和文本分类;
文本挖掘:使用自然语言处理技术,从文本数据中提取有价值的信息;文本聚类:将文本数据进行聚类分析,将具有相似主题或内容的文本归为一类;文本分类:使用机器学习算法,将文本数据进行分类;
数据为时间序列数据时,使用时间序列分解、时间序列模型和季节性分析;
时间序列分解:将时间序列数据分解为趋势、季节性和残差成分,来了解数据的结构和特征;时间序列模型:使用ARIMA和指数平滑建立时间序列模型,进行未来值的预测和趋势分析;季节性分析:检测和分析时间序列数据中的季节性模式和周期性变动;
数据为图像数据时,使用特征提取、图像分类和识别和图像分割;
特征提取:使用计算机视觉技术从图像中提取特征;图像分类和识别:使用深度学习算法,对图像进行分类和识别;图像分割:将图像分割为不同的区域或对象。
S3:对工业物联网数据的融合;在步骤S3中,采用决策级融合策略设计了投票法和权重法两种融合方法,实现多模块数据的融合,决策级融合策略投票融合法或权重融合法;
投票融合法具体包括如下过程:
将各个子模型的决策值作为类别标签进行统计,每个类别标签为一票,以多数表决法获得的得票最高类别作为最终结论输出;
权重融合法具体包括如下过程:
将各个子模型的决策值按照类别对齐后转换并拼接为决策矩阵,使用决策矩阵与权重数组的对应元素相乘,并按列对加权后的各类别概率进行求和,将概率最大的类别作为最终结论输出。
S4:实现可视化平台对所述工业物联网数据进行分析可视化发布。
实施例
基于工业物联网数据可视化的数据发布方法,包括如下步骤:
步骤一、对可视化数据进行预处理:将搜集的数据进行预处理;
为了使分类数据更具有鲁棒性,需对不同数据的输入形式进行预处理,例如统一格式等。
步骤二、对所述异构数据进行分类:针对各数据进行模型设计,实现分类;
针对异构平台数据存在的异构多模态现象,通过数据结构对其进行划分,对不同结构的数据采用了不同的算法实现了分类模型的构建,如对数值型数据,分类型数据,文本数据,时间序列数据,图像数据数据,本发明就基于深度学习技术设计并实现了多个辅助判断模型,针对数据表等结构化的数据,采用结合机器学习算法进行实现;
对于不同数据进行不同的模型设计,进一步包括:
2.1、文本数据:
采用描述统计分析:计算数据的均值、中位数、标准差等统计指标,以了解数据的分布和集中趋势。相关性分析:通过计算相关系数(如Pearson相关系数)来评估数值变量之间的相关性。回归分析:建立数值型变量之间的回归模型,以探索变量之间的线性关系。
2.2、时间序列数据:
时间戳处理:将时间戳转换为适当的时间格式,如年-月-日或年-月-日-时-分-秒。时间间隔计算:计算时间之间的间隔、差异或滞后。季节性调整:对季节性数据进行季节性调整,以消除季节效应。
2.3、数值型数据:
缺失值处理:填充缺失值,可以使用均值、中位数、众数等进行填充,或者使用插值方法进行估算。异常值处理:检测和处理异常值,可以使用统计方法,如基于标准差的方法或箱线图方法。数据平滑:对数据进行平滑处理,如移动平均或指数平滑,以减少噪声。
2.4、图像数据数据
图像缩放和裁剪:调整图像的大小和比例,使其适应特定的分析需求。图像增强:增加对比度、调整亮度等,以增强图像的特征。特征提取:使用计算机视觉技术从图像中提取特征,如边缘检测、颜色直方图等。对于结构化数据,通过joblib库实现了模型的持久化和读取恢复。
2.5、分类型数据
哑变量编码:将分类变量转换为二进制的哑变量(0和1),以便在分析和建模中使用。标签编码:将分类变量编码为整数标签,以便在某些算法中使用。
步骤三、数据融合:对于不同的数据,采取适合的融合技术以获得综合分析结果,进一步包括为:
3.1、特征级融合策略,通常发生在数据预处理阶段,因此也称为早期融合策略。通常会采用机器学习或深度学习的方式对各模态数据进行特征提取,并编码成特定的结构(向量、数组等),再对相同结构的特征采取叠加或拼接的方式进行融合;
3.2、决策级融合策略,决策级融合策略是将不同模态数据分别训练好的模型的最终决策作为融合对象,依据任务的不同,选择适合的融合方法对获得的多个最终决策进行进一步计算以得到最终结果;
所述决策级融合策略为投票融合法或权重融合法:
3.21投票融合法:在投票融合法中,各子模型的决策值为对相应模态数据进行分析后的类别标签,投票时将该类别标签视作一票进行统计,最终得票最多的类别即为融合所得诊断结论,而在统计方法上,采用了相对多数表决法,即只要某一类别的得票数多于其他类别,就输出这一类别作为最终结论。而当出现多个类别得票数相同的情况时,相对多数表决发将在得票相等且最高的多个类别中随机选取一个类别作为最终结论;
相对多数表决法的优点在于不论类别的最高得票是否过半都能做出最终预测,其伪代码如图3所示;
3.22权重融合方法:各数据信息所占重要程度可能并不完全相同,依据各数据应用时的重要程度,系统为处理该模态数据的模型分配相应权重的融合方法则更加适用于这种情形,权重法的伪代码图4所示:
步骤四、可视化数据分析:
如图2所示,基于工业物联网数据可视化平台对所述数据进行发布平台通过对预处理过的数据,选择分为数值型数据,分类型数据,文本数据,时间序列数据,图像数据数据五个子模块,选择分析使用的模型和期望返回的结果类型,并上传待分析数据文件。在确定选择模型和分析类型后,选择适合的融合方法后,即可上传待分析数据并获得可视化分类结果。
因此,本发明采用上述一种工业物联网数据可视化发布方法,以深度学习为主要分析技术,并结合适合的融合策略,实现不同类型的数据的融合判断,达到更精准的分析结果。
最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。
Claims (4)
1.一种工业物联网数据可视化发布方法,其特征在于:设计了一个可视化数据分析平台来辅助进行数据分析,可视化数据分析平台包括前端模块、数据预处理模块、数据分析模块和数据存储模块;
前端模块包括数据预处理、数据分析及结果可视化及模型下载三个功能;
数据预处理模块为训练或待分析数据提供分词、格式转换和数据增广预处理方法;
数据分析模块调用诊断模型对预处理完毕的数据进行类别判断,并返回结果;
数据存储模块包括文件存储和数据库存储,文件存储是将占用资源较大的系统模型或用户数据以文件的形式存储;
具体包括以下步骤:
S1:对工业物联网数据的预处理;
S2:对工业物联网数据进行分类模型的构建;
S3:对工业物联网数据的融合;
S4:实现可视化平台对所述工业物联网数据进行分析可视化发布。
2.根据权利要求1所述的一种工业物联网数据可视化发布方法,其特征在于:在步骤S1中,不同数据类型的预处理方式不同;
处理数值型数据时,使用缺失值处理、异常值处理和数据平滑的预处理方式;
缺失值处理:填充缺失值,使用均值、中位数、众数进行填充,或使用插值方法进行估算;
异常值处理:检测和处理异常值,使用统计方法:基于标准差的方法或箱线图方法;
数据平滑:对数据进行平滑处理,移动平均或指数平滑,减少噪声;
处理分类型数据时,使用哑变量编码和标签编码的预处理方式;
哑变量编码:将分类变量转换为二进制的哑变量;
标签编码:将分类变量编码为整数标签,在算法中使用;
处理文本数据时,使用文本清洗、分词和词干提取和停用词移除的预处理方式;
使用文本清洗:去除特殊字符、标点符号和转换为小写字母;
分词和词干提取:将文本拆分为单词或标记并提取词干;
停用词移除:去除常见的无意义词语;
处理时间序列数据时,使用时间戳处理、时间间隔计算和季节性调整的预处理方式;
时间戳处理:将时间戳转换为适当的时间格式,年-月-日或年-月-日-时-分-秒;
时间间隔计算:计算时间之间的间隔、差异或滞后;
季节性调整:对季节性数据进行季节性调整,消除季节效应;
处理图像数据时,使用图像缩放和裁剪、图像增强和特征提取的预处理方式;
图像缩放和裁剪:调整图像的大小和比例,适应特定的分析需求;
图像增强:增加对比度、调整亮度,增强图像特征;
特征提取:使用计算机视觉技术从图像中提取特征,包括边缘检测、颜色直方图;
根据具体数据集和分析任务的要求进行选择和组合预处理方法。
3.根据权利要求2所述的一种工业物联网数据可视化发布方法,其特征在于:在步骤S2中,数据为数值型数据时,使用描述统计分析、相关性分析和回归分析;
采用描述统计分析:计算数据的均值、中位数和标准差统计指标,了解数据的分布和集中趋势;相关性分析:通过计算相关系数来评估数值变量之间的相关性;回归分析:建立数值型变量之间的回归模型,探索变量之间的线性关系;
数据为分类型数据时,使用频数统计和占比、卡方检验和分类模型;
频数统计和占比:计算每个类别的频数和占比,了解不同类别的分布情况;卡方检验:用于比较两个或多个分类变量之间的关联性和独立性;分类模型:使用机器学习算法建立分类模型,预测或分类新的数据;
数据为文本数据时,使用文本挖掘、文本聚类和文本分类;
文本挖掘:使用自然语言处理技术,从文本数据中提取有价值的信息;文本聚类:将文本数据进行聚类分析,将具有相似主题或内容的文本归为一类;文本分类:使用机器学习算法,将文本数据进行分类;
数据为时间序列数据时,使用时间序列分解、时间序列模型和季节性分析;
时间序列分解:将时间序列数据分解为趋势、季节性和残差成分,来了解数据的结构和特征;时间序列模型:使用ARIMA和指数平滑建立时间序列模型,进行未来值的预测和趋势分析;季节性分析:检测和分析时间序列数据中的季节性模式和周期性变动;
数据为图像数据时,使用特征提取、图像分类和识别和图像分割;
特征提取:使用计算机视觉技术从图像中提取特征;图像分类和识别:使用深度学习算法,对图像进行分类和识别;图像分割:将图像分割为不同的区域或对象。
4.根据权利要求3所述的一种工业物联网数据可视化发布方法,其特征在于:在步骤S3中,采用决策级融合策略设计了投票法和权重法两种融合方法,实现多模块数据的融合,决策级融合策略投票融合法或权重融合法;
投票融合法具体包括如下过程:
将各个子模型的决策值作为类别标签进行统计,每个类别标签为一票,以多数表决法获得的得票最高类别作为最终结论输出;
权重融合法具体包括如下过程:
将各个子模型的决策值按照类别对齐后转换并拼接为决策矩阵,使用决策矩阵与权重数组的对应元素相乘,并按列对加权后的各类别概率进行求和,将概率最大的类别作为最终结论输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410299153.4A CN118132643A (zh) | 2024-03-15 | 2024-03-15 | 一种工业物联网数据可视化发布方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410299153.4A CN118132643A (zh) | 2024-03-15 | 2024-03-15 | 一种工业物联网数据可视化发布方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118132643A true CN118132643A (zh) | 2024-06-04 |
Family
ID=91246911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410299153.4A Pending CN118132643A (zh) | 2024-03-15 | 2024-03-15 | 一种工业物联网数据可视化发布方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118132643A (zh) |
-
2024
- 2024-03-15 CN CN202410299153.4A patent/CN118132643A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117787569B (zh) | 一种智能辅助评标方法及系统 | |
CN117670066B (zh) | 基于智能决策的司库管理方法、系统、设备及存储介质 | |
CN117579513B (zh) | 汇聚分流设备的可视化运维系统及其方法 | |
CN114048436A (zh) | 一种预测企业财务数据模型构建方法及构建装置 | |
CN117710156A (zh) | 一种基于大数据的公路施工优化方法及系统 | |
CN117910673B (zh) | 一种数字孪生消防控制室图形显示系统及方法 | |
CN116861924A (zh) | 基于人工智能的项目风险预警方法及系统 | |
KR102005952B1 (ko) | 기계학습 모델링에서 잡음 데이터 제거를 위한 데이터 정제 장치 및 방법 | |
CN117669384A (zh) | 基于物联网的温度传感器生产智能监测方法及系统 | |
CN118135460A (zh) | 基于机器学习的智慧工地安全监控方法及装置 | |
CN106484913A (zh) | 一种目标图片确定的方法以及服务器 | |
CN111488501A (zh) | 一种基于云平台的电商统计系统 | |
CN113468203B (zh) | 基于循环神经网络与注意力机制的金融用户画像方法 | |
Cao | Design and optimization of a decision support system for sports training based on data mining technology | |
CN113674846A (zh) | 基于lstm网络的医院智慧服务舆情监控平台 | |
CN118132643A (zh) | 一种工业物联网数据可视化发布方法 | |
CN117873837A (zh) | 一种存储设备容量耗尽趋势的分析方法 | |
CN115982646B (zh) | 一种基于云平台的多源测试数据的管理方法及系统 | |
CN115296851B (zh) | 一种基于互信息与灰狼提升算法的网络入侵检测方法 | |
US20170330055A1 (en) | Sequential data analysis apparatus and program | |
CN114757495A (zh) | 一种基于逻辑回归的会员价值量化评估方法 | |
CN114022698A (zh) | 一种基于二叉树结构的多标签行为识别方法及装置 | |
CN118133051B (zh) | 一种要素评估模型的构建方法及装置 | |
CN118193855B (zh) | 一种在线应答方法、装置及计算机设备 | |
CN119007412B (zh) | 一种基于机器学习的猪场疾病监测预警方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |