CN116304112A - 一种基于大数据技术的智能监测方法 - Google Patents

一种基于大数据技术的智能监测方法 Download PDF

Info

Publication number
CN116304112A
CN116304112A CN202310369449.4A CN202310369449A CN116304112A CN 116304112 A CN116304112 A CN 116304112A CN 202310369449 A CN202310369449 A CN 202310369449A CN 116304112 A CN116304112 A CN 116304112A
Authority
CN
China
Prior art keywords
data
analysis
intelligent monitoring
entity
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310369449.4A
Other languages
English (en)
Inventor
于海洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liaoning Technical University
Original Assignee
Liaoning Technical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning Technical University filed Critical Liaoning Technical University
Priority to CN202310369449.4A priority Critical patent/CN116304112A/zh
Publication of CN116304112A publication Critical patent/CN116304112A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于大数据技术的智能监测方法,属于数据监测技术领域,该监测方法具体步骤如下:(1)构建分析图谱以组成分析图谱库并实时更新;(2)对收集的各待检数据进行分类处理;(3)预处理各待检数据再对其进行监测分析;(4)工作人员查看分析结果并下发相关控制指令;(5)采集管理平台日志数据以进行分析管控;本发明能够自行建模寻参,降低操作难度,方便工作人员使用,同时有效提高了监测效率,并且保证监测准确性,能够给采集数据带来便利性,同时能够实现无需相关专业知识也可进行日志数据分析,而且不用每次收集日志都进行配置操作,节省了工作人员配置时间。

Description

一种基于大数据技术的智能监测方法
技术领域
本发明涉及数据监测技术领域,尤其涉及一种基于大数据技术的智能监测方法。
背景技术
随着互联网的发展,随着云时代的到来,大数据成为了很多人关注的方面。一个公司所创造出来的数据,通常会被用大数据来形容,将这些数据下载到数据库当中,并且进行分析时,会花费过多的时间以及金钱。随着云时代的来临,大数据也吸引了越来越多的关注。分析师团队认为,大数据通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。而使用大数据对数据进行监测成为数据筛选的重要手段之一;因此,发明出一种基于大数据技术的智能监测方法变得尤为重要。
现有的基于大数据技术的智能监测方法操作难度较高,不方便工作人员使用,降低监测效率且监测准确性差;此外,现有的基于大数据技术的智能监测方法需相关专业知识才可进行日志数据分析,同时不方便数据采集,每次收集日志都需要配置操作;为此,我们提出一种基于大数据技术的智能监测方法。
发明内容
本发明的目的是为了解决现有技术中存在的缺陷,而提出的一种基于大数据技术的智能监测方法。
为了实现上述目的,本发明采用了如下技术方案:
一种基于大数据技术的智能监测方法,该监测方法具体步骤如下:
(1)构建分析图谱以组成分析图谱库并实时更新;
(2)对收集的各待检数据进行分类处理;
(3)预处理各待检数据再对其进行监测分析;
(4)工作人员查看分析结果并下发相关控制指令;
(5)采集管理平台日志数据以进行分析管控。
作为本发明的进一步方案,步骤(1)中所述分析图谱具体构建步骤如下:
步骤一:工作人员选择相关领域作为知识范围,之后通过爬虫抓取互联网中相关领域的数据,同时接收工作人员上传的有关数据,并提取各组特征关键词,同时将各特征关键词转换为词向量;
步骤二:构建TransD模型接收各组数据,并通过TransD模型使用prefer向量表示空间中原点到财务信息嵌入的向量,同时对特定信息的偏好程度通过prefer和该信息的欧几里得距离进行衡量;
步骤三:构造主题文本知识子图,并依照实体提取子图中与实体相连的关系,采用知识图谱嵌入模型进行学习,把学习到的实体向量作为CNN层的输入,并输出相对应的实体表以及关系表,之后安装配置Neo4j数据库,同时启动Neo4j服务并导入数据以完成分析图谱构建。
作为本发明的进一步方案,步骤三中所述知识图谱嵌入模型学习训练具体步骤如下:
步骤Ⅰ:将主题特征向量、词语-实体对齐后的实体向量以及相关实体上下文向量输入知识图谱嵌入模型中,再通过关系-实体对齐转换函数将实体向量、上下文实体向量从实体空间映射到词向量空间,并将特征连接在一起作为输入;
步骤Ⅱ:将主题描述文本输入Softmax分类器中,并经过归一化得到主题文本在第k种主题的输出概率,同时采用自适应矩阵估计算法最小化目标函数,再通过反向传播更新每轮迭代过程网络的各种参数,直到模型符合拟合要求为止。
作为本发明的进一步方案,步骤(3)中所述待检数据具体预处理步骤如下:
步骤①:通过归一化方法将各组待检数据转换至0到1的区间内,之后计算转换后的各组待检数据的方差系数,若方差系数越大,则表示越重要,反之,则表示不重要,并将其剔除;
步骤②:将剩余待检数据归一化后的值作为其标签,并将待检数据划分为训练集以及测试集,同时对训练集进行标准化处理以获取训练样本。
作为本发明的进一步方案,步骤①中所述归一化方法具体计算公式如下:
Figure BDA0004168137990000031
(1)
其中,xnew表示归一化后的数据;x表示提取的特征数据;xmax表示特征数据的最大值;xmin表示特征数据的最小值;
步骤①所述特征降维具体计算公式如下:
Figure BDA0004168137990000041
(2)
其中,σ表示特征数据的标准差,μ表示特征数据的均值,CV表示特征数据的方差系数。
作为本发明的进一步方案,步骤(3)中所述监测分析具体步骤如下:
第一步:收集过往监测数据,之后构建一组卷积神经网络,并将过往监测数据导入卷积神经网络中通过输入、卷积、池化、全连接和输出进行学习训练,得到智能监测模型;
第二步:对该智能监测模型进行测试,若测试准确率满足期望值,则停止训练,反之继续对其进行训练,并对其参数进行更新调整,将分析图谱库与智能监测模型通信连接;
第三步:智能监测模型接收训练样本以进行迭代训练,之后将测试集导入训练完成的模型中,并输出分析曲线,同时依据分析图谱库对各待检数据进行类型匹配,同时输出匹配结果。
作为本发明的进一步方案,步骤(5)中所述日志数据分析管控具体步骤如下:
第Ⅰ步:在不同的系统的管理平台部署相关的日志采集插件或者通过syslog服务器获取不同系统的管理平台中所记录的日志数据,并筛选出满足工作人员预设条件的日志信息;
第Ⅱ步:将剩余日志数据处理为统一格式的日志信息,再将处理后的日志信息中记录的用户操作行为与异常行为特征进行匹配,并依据匹配结果生成相对应的告警信息,同时对各告警信息风险分数进行计算并输出计算结果,之后将该告警信息反馈给相关工作人员,并中断相关操作进程。
相比于现有技术,本发明的有益效果在于:
1、该基于大数据技术的智能监测方法通过选择相关领域作为知识范围,之后通过爬虫抓取互联网中相关领域的数据,同时接收工作人员上传的有关数据以构建分析图谱,之后对待检数据进行预处理以获取训练样本以及测试集,收集过往监测数据,之后构建一组卷积神经网络,并将过往监测数据导入卷积神经网络中通过输入、卷积、池化、全连接和输出进行学习训练,得到智能监测模型,对该智能监测模型进行测试,若测试准确率满足期望值,则停止训练,反之继续对其进行训练,并对其参数进行更新调整,将分析图谱库与智能监测模型通信连接,智能监测模型接收训练样本以进行迭代训练,之后将测试集导入训练完成的模型中,并输出分析曲线,同时依据分析图谱库对各待检数据进行类型匹配,同时输出匹配结果,能够自行建模寻参,降低操作难度,方便工作人员使用,同时有效提高了监测效率,并且保证监测准确性。
2、该基于大数据技术的智能监测方法通过在不同的系统的管理平台部署相关的日志采集插件或者通过syslog服务器获取不同系统的管理平台中所记录的日志数据,并筛选出满足工作人员预设条件的日志信息,将剩余日志数据处理为统一格式的日志信息,再将处理后的日志信息中记录的用户操作行为与异常行为特征进行匹配,并依据匹配结果生成相对应的告警信息,同时对各告警信息风险分数进行计算并输出计算结果,之后将该告警信息反馈给相关工作人员,并中断相关操作进程,能够给采集数据带来便利性,同时能够实现无需相关专业知识也可进行日志数据分析,而且不用每次收集日志都进行配置操作,节省了工作人员配置时间。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1为本发明提出的一种基于大数据技术的智能监测方法的流程框图。
具体实施方式
实施例1
参照图1,一种基于大数据技术的智能监测方法,该监测方法具体步骤如下:
构建分析图谱以组成分析图谱库并实时更新。
具体的,工作人员选择相关领域作为知识范围,之后通过爬虫抓取互联网中相关领域的数据,同时接收工作人员上传的有关数据,并提取各组特征关键词,同时将各特征关键词转换为词向量,构建TransD模型接收各组数据,并通过TransD模型使用prefer向量表示空间中原点到财务信息嵌入的向量,同时对特定信息的偏好程度通过prefer和该信息的欧几里得距离进行衡量,构造主题文本知识子图,并依照实体提取子图中与实体相连的关系,采用知识图谱嵌入模型进行学习,把学习到的实体向量作为CNN层的输入,并输出相对应的实体表以及关系表,之后安装配置Neo4j数据库,同时启动Neo4j服务并导入数据以完成分析图谱构建。
需要进一步说明的是,将主题特征向量、词语-实体对齐后的实体向量以及相关实体上下文向量输入知识图谱嵌入模型中,再通过关系-实体对齐转换函数将实体向量、上下文实体向量从实体空间映射到词向量空间,并将特征连接在一起作为输入,将主题描述文本输入Softmax分类器中,并经过归一化得到主题文本在第k种主题的输出概率,同时采用自适应矩阵估计算法最小化目标函数,再通过反向传播更新每轮迭代过程网络的各种参数,直到模型符合拟合要求为止。
对收集的各待检数据进行分类处理。
预处理各待检数据再对其进行监测分析。
具体的,通过归一化方法将各组待检数据转换至0到1的区间内,之后计算转换后的各组待检数据的方差系数,若方差系数越大,则表示越重要,反之,则表示不重要,并将其剔除,将剩余待检数据归一化后的值作为其标签,并将待检数据划分为训练集以及测试集,同时对训练集进行标准化处理以获取训练样本。
本实施例中,归一化方法具体计算公式如下:
Figure BDA0004168137990000081
(1)
其中,xnew表示归一化后的数据;x表示提取的特征数据;xmax表示特征数据的最大值;xmin表示特征数据的最小值;
特征降维具体计算公式如下:
Figure BDA0004168137990000082
(2)
其中,σ表示特征数据的标准差,μ表示特征数据的均值,CV表示特征数据的方差系数。
具体的,收集过往监测数据,之后构建一组卷积神经网络,并将过往监测数据导入卷积神经网络中通过输入、卷积、池化、全连接和输出进行学习训练,得到智能监测模型,对该智能监测模型进行测试,若测试准确率满足期望值,则停止训练,反之继续对其进行训练,并对其参数进行更新调整,将分析图谱库与智能监测模型通信连接,智能监测模型接收训练样本以进行迭代训练,之后将测试集导入训练完成的模型中,并输出分析曲线,同时依据分析图谱库对各待检数据进行类型匹配,同时输出匹配结果。
实施例2
参照图1,一种基于大数据技术的智能监测方法,该监测方法具体步骤如下:
工作人员查看分析结果并下发相关控制指令。
采集管理平台日志数据以进行分析管控。
具体的,在不同的系统的管理平台部署相关的日志采集插件或者通过syslog服务器获取不同系统的管理平台中所记录的日志数据,并筛选出满足工作人员预设条件的日志信息,将剩余日志数据处理为统一格式的日志信息,再将处理后的日志信息中记录的用户操作行为与异常行为特征进行匹配,并依据匹配结果生成相对应的告警信息,同时对各告警信息风险分数进行计算并输出计算结果,之后将该告警信息反馈给相关工作人员,并中断相关操作进程。

Claims (7)

1.一种基于大数据技术的智能监测方法,其特征在于,该监测方法具体步骤如下:
(1)构建分析图谱以组成分析图谱库并实时更新;
(2)对收集的各待检数据进行分类处理;
(3)预处理各待检数据再对其进行监测分析;
(4)工作人员查看分析结果并下发相关控制指令;
(5)采集管理平台日志数据以进行分析管控。
2.根据权利要求1所述的一种基于大数据技术的智能监测方法,其特征在于,步骤(1)中所述分析图谱具体构建步骤如下:
步骤一:工作人员选择相关领域作为知识范围,之后通过爬虫抓取互联网中相关领域的数据,同时接收工作人员上传的有关数据,并提取各组特征关键词,同时将各特征关键词转换为词向量;
步骤二:构建TransD模型接收各组数据,并通过TransD模型使用prefer向量表示空间中原点到财务信息嵌入的向量,同时对特定信息的偏好程度通过prefer和该信息的欧几里得距离进行衡量;
步骤三:构造主题文本知识子图,并依照实体提取子图中与实体相连的关系,采用知识图谱嵌入模型进行学习,把学习到的实体向量作为CNN层的输入,并输出相对应的实体表以及关系表,之后安装配置Neo4j数据库,同时启动Neo4j服务并导入数据以完成分析图谱构建。
3.根据权利要求2所述的一种基于大数据技术的智能监测方法,其特征在于,步骤三中所述知识图谱嵌入模型学习训练具体步骤如下:
步骤Ⅰ:将主题特征向量、词语-实体对齐后的实体向量以及相关实体上下文向量输入知识图谱嵌入模型中,再通过关系-实体对齐转换函数将实体向量、上下文实体向量从实体空间映射到词向量空间,并将特征连接在一起作为输入;
步骤Ⅱ:将主题描述文本输入Softmax分类器中,并经过归一化得到主题文本在第k种主题的输出概率,同时采用自适应矩阵估计算法最小化目标函数,再通过反向传播更新每轮迭代过程网络的各种参数,直到模型符合拟合要求为止。
4.根据权利要求1所述的一种基于大数据技术的智能监测方法,其特征在于,步骤(3)中所述待检数据具体预处理步骤如下:
步骤①:通过归一化方法将各组待检数据转换至0到1的区间内,之后计算转换后的各组待检数据的方差系数,若方差系数越大,则表示越重要,反之,则表示不重要,并将其剔除;
步骤②:将剩余待检数据归一化后的值作为其标签,并将待检数据划分为训练集以及测试集,同时对训练集进行标准化处理以获取训练样本。
5.根据权利要求4所述的一种基于大数据技术的智能监测方法,其特征在于,步骤①中所述归一化方法具体计算公式如下:
Figure FDA0004168137980000021
其中,xnew表示归一化后的数据;x表示提取的特征数据;xmax表示特征数据的最大值;xmin表示特征数据的最小值;
步骤①所述特征降维具体计算公式如下:
Figure FDA0004168137980000031
其中,σ表示特征数据的标准差,μ表示特征数据的均值,CV表示特征数据的方差系数。
6.根据权利要求4所述的一种基于大数据技术的智能监测方法,其特征在于,步骤(3)中所述监测分析具体步骤如下:
第一步:收集过往监测数据,之后构建一组卷积神经网络,并将过往监测数据导入卷积神经网络中通过输入、卷积、池化、全连接和输出进行学习训练,得到智能监测模型;
第二步:对该智能监测模型进行测试,若测试准确率满足期望值,则停止训练,反之继续对其进行训练,并对其参数进行更新调整,将分析图谱库与智能监测模型通信连接;
第三步:智能监测模型接收训练样本以进行迭代训练,之后将测试集导入训练完成的模型中,并输出分析曲线,同时依据分析图谱库对各待检数据进行类型匹配,同时输出匹配结果。
7.根据权利要求1所述的一种基于大数据技术的智能监测方法,其特征在于,步骤(5)中所述日志数据分析管控具体步骤如下:
第Ⅰ步:在不同的系统的管理平台部署相关的日志采集插件或者通过syslog服务器获取不同系统的管理平台中所记录的日志数据,并筛选出满足工作人员预设条件的日志信息;
第Ⅱ步:将剩余日志数据处理为统一格式的日志信息,再将处理后的日志信息中记录的用户操作行为与异常行为特征进行匹配,并依据匹配结果生成相对应的告警信息,同时对各告警信息风险分数进行计算并输出计算结果,之后将该告警信息反馈给相关工作人员,并中断相关操作进程。
CN202310369449.4A 2023-04-07 2023-04-07 一种基于大数据技术的智能监测方法 Pending CN116304112A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310369449.4A CN116304112A (zh) 2023-04-07 2023-04-07 一种基于大数据技术的智能监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310369449.4A CN116304112A (zh) 2023-04-07 2023-04-07 一种基于大数据技术的智能监测方法

Publications (1)

Publication Number Publication Date
CN116304112A true CN116304112A (zh) 2023-06-23

Family

ID=86832474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310369449.4A Pending CN116304112A (zh) 2023-04-07 2023-04-07 一种基于大数据技术的智能监测方法

Country Status (1)

Country Link
CN (1) CN116304112A (zh)

Similar Documents

Publication Publication Date Title
WO2021103492A1 (zh) 一种企业经营风险预测方法和系统
WO2018000269A1 (zh) 一种基于数据挖掘和众包的数据标注方法及系统
CN112859822B (zh) 基于人工智能的设备健康分析及故障诊断的方法及系统
CN108629413A (zh) 神经网络模型训练、交易行为风险识别方法及装置
WO2021159834A1 (zh) 异常信息处理节点分析方法、装置、介质及电子设备
CN109408574B (zh) 基于文本挖掘技术的投诉责任认定系统
WO2021174812A1 (zh) 用于画像的数据的清洗方法、装置、介质及电子设备
CN112579789A (zh) 一种设备故障诊断的方法和装置及设备
CN116089873A (zh) 模型训练方法、数据分类分级方法、装置、设备及介质
CN113590807A (zh) 一种基于大数据挖掘的科技企业信用评价方法
CN116756688A (zh) 一种基于多模态融合算法的舆情风险发现方法
CN115269870A (zh) 一种基于知识图谱实现数据中台数据链路故障分类预警的方法
CN113704389A (zh) 一种数据评估方法、装置、计算机设备及存储介质
CN117131449A (zh) 面向数据治理的具有传播学习能力的异常识别方法及系统
CN112200465A (zh) 基于多媒体信息智能分析的电力ai方法及系统
CN116304112A (zh) 一种基于大数据技术的智能监测方法
CN116431828A (zh) 一种基于神经网络技术构建的电网中台数据资产知识图谱数据库的构建方法
CN113554010B (zh) 一种电网线路故障识别模型训练方法
CN113705695A (zh) 一种基于卷积神经网络的配电网故障数据辨识方法
CN112579429A (zh) 一种问题定位方法和装置
CN117892091B (zh) 基于人工智能的数据智能分析方法及系统
CN116993307B (zh) 一种具有人工智能学习能力的协同办公方法及系统
CN111538843B (zh) 游戏领域的知识图谱关系匹配方法、模型构建方法及装置
CN116974862A (zh) Sql处理方法、装置、设备及存储介质
CN117972595A (zh) 一种电费异常分析方法、系统、装置和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination