CN116882538A - 一种海洋环境预测模型的训练方法及相关装置 - Google Patents
一种海洋环境预测模型的训练方法及相关装置 Download PDFInfo
- Publication number
- CN116882538A CN116882538A CN202310601024.1A CN202310601024A CN116882538A CN 116882538 A CN116882538 A CN 116882538A CN 202310601024 A CN202310601024 A CN 202310601024A CN 116882538 A CN116882538 A CN 116882538A
- Authority
- CN
- China
- Prior art keywords
- model
- prediction
- knowledge graph
- time sequence
- marine environment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012549 training Methods 0.000 title claims abstract description 35
- 238000010219 correlation analysis Methods 0.000 claims abstract description 41
- 238000011156 evaluation Methods 0.000 claims abstract description 41
- 230000007613 environmental effect Effects 0.000 claims abstract description 18
- 238000001514 detection method Methods 0.000 claims abstract description 16
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 10
- 239000002131 composite material Substances 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000011157 data evaluation Methods 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 6
- 238000004140 cleaning Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种海洋环境预测模型的训练方法及相关装置。该方法包括如下步骤:获取海洋环境数据并进行预处理;运用灰色关联分析模型对预处理后的环境数据分析,获得数据集;将数据集输入构建的时序知识图谱模型进行训练,以预测时序知识图谱中实体之间的关系,生成预测模型;按照预测目标的时序信息,使用已训练好的知识图谱预测模型,通过预测目标实体与其他实体之间的前后依赖关系,对海洋环境检测领域时序知识图谱进行链路预测;对链路预测的结果进行评估,基于评估结果对灰色关联分析模型和时序知识图谱预测模型进行优化和调整。本发明可以实现更高的预测准确率,以提高海洋环境检测领域的预测能力。
Description
技术领域
本发明涉及知识图谱技术领域,尤其涉及一种海洋环境预测模型的训练方法及相关装置。
背景技术
随着近年来大数据、人工智能等新兴技术的快速发展,海洋环境的数据资源才获得整合。采用先进的智能算法对这些数据进行分析,可以提高海洋环境预测的准确性。目前,海洋环境预测主流的算法有:线性预测模型、时间序列预测模型、多元回归模型、神经网络模型等。
现有的海洋环境预测方法存在以下缺点:
(1)海洋环境因素繁多,所以造成海洋数据表现出不规律的变化。线性预测模型往往不能准确预测海洋数据,而采用多种数值型参数融合的预测模型则容易叠加噪声信号,导致误差增加,不利于对海洋数据的准确预测。此外,结合遥感和视频等多种数据的预测模型结构更加复杂,需要耗费更多的时间,难以满足海洋环境数据实时预测的实际需求;
(2)时间序列预测模型和多元回归模型计算简便,预测快速,因此在短期预测效果具有很大的优势。然而,如果忽略样本之间的分布规律,预测效果将受到严重影响;BP神经网络的学习和收敛速度较慢,因此BP神经网络预测模型的预测精度相对较低;
(3)静态数据的预测通常使用知识图谱链路预测模型,但是海洋大多数数据都是动态的,具有时序性,因此难以对其进行准确且高效的预测。
发明内容
为了解决上述技术问题,本发明提出一种海洋环境预测模型的训练方法及相关装置。在所述方法及相关装置中,可以实现更高的预测准确率,以提高海洋环境检测领域的预测能力。
为了达到上述目的,本发明的技术方案如下:
一种海洋环境预测模型的训练方法,包括如下步骤:
获取海洋环境数据并进行预处理;
运用灰色关联分析模型对预处理后的环境数据分析,获得数据集;
将数据集输入构建的时序知识图谱模型进行训练,以预测时序知识图谱中实体之间的关系,生成预测模型;
按照预测目标的时序信息,使用已训练好的知识图谱预测模型,通过预测目标实体与其他实体之间的前后依赖关系,对海洋环境检测领域时序知识图谱进行链路预测;
对链路预测的结果进行评估,基于评估结果对灰色关联分析模型和时序知识图谱预测模型进行优化和调整。
优选地,所述预处理为将海洋环境数据中的异常值、重复值和缺失值高于预设阈值的特征进行删除。
优选地,所述运用灰色关联分析模型对预处理后的环境数据分析,获得数据集,具体包括如下步骤:
提取海洋环境数据评价指标,确定变量参数序列和变量比较序列;
将变量参数序列和变量比较序列进行归一化处理;
基于处理后的变量参数序列和变量比较序列,计算评价指标的关联系数;
将海洋环境数据的变量参数序列和变量比较序列在各个时刻的评价指标的关联系数求平均值,获得评价指标间的关联度;
将评价指标间的关联度进行排序,基于排序结果确定评价指标之间的相关性,生成数据集。
优选地,采用ConvE模型构建时序知识图谱模型,具体包括如下
对实体和关系进行向量映射,获得实体嵌入矩阵和关系嵌入矩阵;
将关系嵌入矩阵中的每个元素放在对角线上进行变换,获得关系矩阵;
基于实体嵌入矩阵和关系矩阵,获得实体关系复合矩阵W,如下式:
式中,Mr关系矩阵,de是实体嵌入的维度,dr是关系嵌入的维度,dk是卷积核的数量;
对实体关系复合矩阵进行卷积处理,对卷积运算后的结果逐特征层进行非线性激活处理,提取时序知识图谱中实体和关系间向量化表示;
通过softmat函数,输出预测结果。
优选地,通过HiSMatch历史结构匹配模型进行深层学习,对所述预测模型进行优化,所述HiSMatch历史结构匹配模型架构为:
通过时序知识图谱提取链路的特征向量:Fi=[f1,f2,...,fn]T
式中,Fi是第i个链路的特征向量,f1到fn是n个特征值;
将特征向量和历史链路数据作为输入,利用GRU模型进行链路预测,如下:
pi=σ(Wp[hi-1,Fi]+bp)
式中,pi是第i个链路的预测概率,σ是sigmoid函数,Wp和bp是模型参数,hi-1是前一个时间步的隐藏状态。
优选地,所述预测模型采用交叉熵损失函数,如下:
其中,L是损失函数,yi是第i个链路的真实标签,m是链路的数量。
优选地,所述评估包括误差分析和准确率分析。
基于上述内容,本发明还公开了一种海洋环境预测模型的训练装置,包括:数据采集模块、灰色关联分析模块、建立时序知识图谱模块、数据预测模块和模型评估和调整模块,其中,
所述数据采集模块,用于获取海洋环境数据并进行预处理;
所述灰色关联分析模块,用于运用灰色关联分析模型对预处理后的环境数据分析,获得数据集;
所述建立时序知识图谱模块,用于将数据集输入构建的时序知识图谱模型进行训练,以预测时序知识图谱中实体之间的关系,生成预测模型;
所述数据预测模块,用于按照预测目标的时序信息,使用已训练好的知识图谱预测模型,通过预测目标实体与其他实体之间的前后依赖关系,对海洋环境检测领域时序知识图谱进行链路预测;
所述模型评估和调整模块,用于对链路预测的结果进行评估,基于评估结果对灰色关联分析模型和时序知识图谱预测模型进行优化和调整。
基于上述内容,本发明还公开了一种计算机设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上述任一所述的方法。
基于上述内容,本发明还公开了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一所述的方法。
基于上述技术方案,本发明的有益效果是:本发明首先进行数据采集,获取海洋环境数据,包括水质、盐度、温度以及其他相关数据;再进行数据清洗,对采集到的数据进行清洗,包括去除异常值、缺失值或重复值等;进行灰色关联分析,运用灰色关联分析方法,对各个环境数据进行关联系数计算和排序,以确定变量之间的相关性,生成一个特征集合;再进行建立时序知识图谱模型,针对灰色关联分析的特征集合,构建知识图谱模型进行训练,以预测目标实体与其他实体之间的关系,生成预测模型;并进行数据预测,按照预测目标的时序信息,使用已训练好的知识图谱预测模型,通过预测目标实体与其他实体之间的依赖关系,对海洋环境检测领域时序知识图谱进行链路预测;进行模型评估,最后对预测结果进行评估,包括误差分析、准确率分析等,以确定预测模型的可靠性。本发明采用HiSMatch历史结构匹配模型,可以突显海洋环境评价指标之间潜在的语义信息和多元信息,利用序列化学习有效地挖掘其依赖关系,弥补了传统链路预测模型准确度较低的局限性,提高了灰色关联分析和时序知识图谱相结合的链路预测的准确性。
附图说明
图1是一个实施例中一种海洋环境预测模型的训练方法的应用环境图;
图2是一个实施例中一种海洋环境预测模型的训练方法的流程示意图;
图3是模型的框架结构示意图;
图4是一个实施例中一种海洋环境预测模型的训练装置的结构框图;
图5是一个实施例中计算机设备的内部结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本申请实施例提供的一种海洋环境预测模型的训练方法,可以应用于如图1所示的应用环境中。如图1所示,该应用环境包括计算机设备110。计算机设备110可以获取海洋环境数据并进行预处理;计算机设备110可以运用灰色关联分析模型对预处理后的环境数据分析,获得数据集;计算机设备110可以将数据集输入构建的时序知识图谱模型进行训练,以预测时序知识图谱中实体之间的关系,生成预测模型;计算机设备110可以按照预测目标的时序信息,使用已训练好的知识图谱预测模型,通过预测目标实体与其他实体之间的前后依赖关系,对海洋环境检测领域时序知识图谱进行链路预测;计算机设备110可以对链路预测的结果进行评估,基于评估结果对灰色关联分析模型和时序知识图谱预测模型进行优化和调整。其中,计算机设备110可以但不限于是各种个人计算机、笔记本电脑、机器人、平板电脑等设备。
在一个实施例中,如图2、3所示,提供了一种海洋环境预测模型的训练方法,包括如下步骤:
步骤202,获取海洋环境数据并进行预处理。
计算机设备可以通过爬虫技术从网站中获取到海洋环境数据,包括水质、盐度、温度以及其他相关数据;对采集到的数据进行预处理,将海洋环境数据中的异常值、重复值和缺失值高于预设阈值的特征进行删除。
步骤204,运用灰色关联分析模型对预处理后的环境数据分析,获得数据集。
计算机设备可以采用灰色关联分析模型对预处理后的各个环境数据进行关联系数计算和排序,以确定变量之间的相关性,生成一个特征集合。具体地,采用灰色关联分析将各个海洋环境影响因素的数据序列按照大小排序,并将它们转化为灰色数列;然后,将灰色数列进行关联计算,评估各个因素之间的关联度,进而确定各个因素的重要程度和对结果的贡献度。这样做的好处是,灰色关联分析是一种用于研究因素之间关联度的方法,可以用于分析在海洋环境中影响因素之间的关系,为下一步建立精确的海洋环境检测领域的知识图谱做准备。
步骤206,将数据集输入构建的时序知识图谱模型进行训练,以预测时序知识图谱中实体之间的关系,生成预测模型。
计算机设备进行建立时序知识图谱模型,针对灰色关联分析的特征集合,构建时序知识图谱模型进行训练,以预测目标实体与其他实体之间的关系,生成预测模型。具体的,采用ConvE模型将对实体和关系进行向量映射,获得实体嵌入矩阵和关系嵌入矩阵,然后使用卷积操作来学习实体之间的关系,实现对时序知识图谱中的实体和复杂语义关系的向量化。其ConvE模型架构为:
实体嵌入矩阵表示:
其中,de是实体嵌入的维度,|E|是实体的数量。
关系嵌入矩阵表示:
其中,dr是关系嵌入的维度,|E|是关系的数量。
关系矩阵表示:
其中,diag(R)表示将关系嵌入矩阵中的每个元素放在对角线上,从而形成对角矩阵。
实体关系复合矩阵表示:
其中,dk是卷积核的数量。
卷积操作:
其中,conv(W,w)表示卷积操作,w是卷积核,b是偏置项,f是输出的实体关系复合向量。
输出层:
其中,U是输出层的权重矩阵,是输出的预测结果,softmax是归一化函数。
步骤208,按照预测目标的时序信息,使用已训练好的知识图谱预测模型,通过预测目标实体与其他实体之间的前后依赖关系,对海洋环境检测领域时序知识图谱进行链路预测。
计算机设备进行数据预测,按照预测目标的时序信息,使用已训练好的知识图谱预测模型,采用HiSMatch历史结构匹配模型,可以突显海洋环境指标之间潜在的语义信息和多元信息,利用序列化学习有效地挖掘预测目标实体与其他实体之间的依赖关系,对海洋环境检测领域时序知识图谱进行链路预测,弥补了传统链路预测模型准确度较低的局限性。
步骤210,对链路预测的结果进行评估,基于评估结果对灰色关联分析模型和时序知识图谱预测模型进行优化和调整。
计算机设备进行模型评估,最后对预测结果进行评估,包括误差分析、准确率分析等,以确定预测模型的可靠性。
本实施例中,首先进行数据采集,获取海洋环境数据,包括水质、盐度、温度以及其他相关数据;再进行数据清洗,对采集到的数据进行清洗,包括去除异常值、缺失值或重复值等;进行灰色关联分析,运用灰色关联分析方法,对各个环境数据进行关联系数计算和排序,以确定变量之间的相关性,生成一个特征集合;再进行建立时序知识图谱模型,针对灰色关联分析的特征集合,构建知识图谱模型进行训练,以预测目标实体与其他实体之间的关系,生成预测模型;并进行数据预测,按照预测目标的时序信息,使用已训练好的知识图谱预测模型,通过预测目标实体与其他实体之间的依赖关系,对海洋环境检测领域时序知识图谱进行链路预测;进行模型评估,最后对预测结果进行评估,包括误差分析、准确率分析等,以确定预测模型的可靠性。具体采用HiSMatch历史结构匹配模型,可以突显海洋环境指标之间潜在的语义信息和多元信息,利用序列化学习有效地挖掘其依赖关系,弥补了传统链路预测模型准确度较低的局限性,提高了灰色关联分析和时序知识图谱相结合的链路预测的准确性。
在一个实施例中,提供的一种海洋环境预测模型的训练方法还可以包括运用灰色关联分析模型对预处理后的环境数据分析,获得数据集的过程,具体过程包括如下步骤:
提取海洋环境数据评价指标,确定变量参数序列和变量比较序列,
xj=(xj(1),xj(2),xj(3),…xj(k),…xj(n))
xi=(xi(1),xi(2),xi(3),…xi(k),…xi(n)),i=1,2,3,…m
其中,海洋环境评价对象有m个,海洋环境评价指标有n个,xj是评价指标的参考数列,xi是评价对象的比较数列;
将变量参数序列和变量比较序列进行归一化处理,如下:
其中,xj'(k)为数据处理后的参数数列,xi'(k)为数据处理后的比较数列。
基于处理后的变量参数序列和变量比较序列,计算评价指标的关联系数,如上:
其中,ρ为分辨系数,ξji(k)为关联系数,能反映出点和点之间的相关性;
将海洋环境数据的变量参数序列和变量比较序列在各个时刻的评价指标的关联系数求平均值,获得评价指标间的关联度,如下:
其中,变量rji为相关度。结合实际背景,有正面作用的我们称之为正相关。有负面作用的,我们称之为负相关。|rji|>0.7我们称之为强相关,|rji|<0.3我们称之为弱相关;
将评价指标间的关联度进行排序,基于排序结果确定评价指标之间的相关性,生成数据集。
在一个实施例中,提供的一种海洋环境预测模型的训练方法还包括通过HiSMatch历史结构匹配模型进行深层学习,对所述预测模型进行优化的过程,其HiSMatch历史结构匹配模型架构为:
通过时序知识图谱提取链路的特征向量:Fi=[f1,f2,...,fn]T
式中,Fi是第i个链路的特征向量,f1到fn是n个特征值,T代表对矩阵的转置;
将特征向量和历史链路数据作为输入,利用GRU(门控循环单元)模型进行链路预测,如下:
pi=σ(Wp[hi-1,Fi]+bp)
式中,pi是第i个链路的预测概率,σ是sigmoid函数,Wp和bp是模型参数,hi-1是前一个时间步的隐藏状态。
最后通过交叉熵损失函数来优化模型,如下:
其中,L是损失函数,yi是第i个链路的真实标签(存在或不存在),m是链路的数量。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种海洋环境预测模型的训练装置300,其特征在于,包括:数据采集模块310、灰色关联分析模块320、建立时序知识图谱模块330、数据预测模块340和模型评估和调整模块350,其中,
所述数据采集模块310,用于获取海洋环境数据并进行预处理;
所述灰色关联分析模块320,用于运用灰色关联分析模型对预处理后的环境数据分析,获得数据集;
所述建立时序知识图谱模块330,用于将数据集输入构建的时序知识图谱模型进行训练,以预测时序知识图谱中实体之间的关系,生成预测模型;
所述数据预测模块340,用于按照预测目标的时序信息,使用已训练好的知识图谱预测模型,通过预测目标实体与其他实体之间的前后依赖关系,对海洋环境检测领域时序知识图谱进行链路预测;
所述模型评估和调整模块350,用于对链路预测的结果进行评估,基于评估结果对灰色关联分析模型和时序知识图谱预测模型进行优化和调整。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种海洋环境预测模型的训练方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取海洋环境数据并进行预处理;
运用灰色关联分析模型对预处理后的环境数据分析,获得数据集;
将数据集输入构建的时序知识图谱模型进行训练,以预测时序知识图谱中实体之间的关系,生成预测模型;
按照预测目标的时序信息,使用已训练好的知识图谱预测模型,通过预测目标实体与其他实体之间的前后依赖关系,对海洋环境检测领域时序知识图谱进行链路预测;
对链路预测的结果进行评估,基于评估结果对灰色关联分析模型和时序知识图谱预测模型进行优化和调整。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取海洋环境数据并进行预处理;
运用灰色关联分析模型对预处理后的环境数据分析,获得数据集;
将数据集输入构建的时序知识图谱模型进行训练,以预测时序知识图谱中实体之间的关系,生成预测模型;
按照预测目标的时序信息,使用已训练好的知识图谱预测模型,通过预测目标实体与其他实体之间的前后依赖关系,对海洋环境检测领域时序知识图谱进行链路预测;
对链路预测的结果进行评估,基于评估结果对灰色关联分析模型和时序知识图谱预测模型进行优化和调整。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种海洋环境预测模型的训练方法,其特征在于,包括如下步骤:
获取海洋环境数据并进行预处理;
运用灰色关联分析模型对预处理后的环境数据分析,获得数据集;
将数据集输入构建的时序知识图谱模型进行训练,以预测时序知识图谱中实体之间的关系,生成预测模型;
按照预测目标的时序信息,使用已训练好的知识图谱预测模型,通过预测目标实体与其他实体之间的前后依赖关系,对海洋环境检测领域时序知识图谱进行链路预测;
对链路预测的结果进行评估,基于评估结果对灰色关联分析模型和时序知识图谱预测模型进行优化和调整。
2.根据权利要求1所述的一种海洋环境预测模型的训练方法,其特征在于,所述预处理为将海洋环境数据中的异常值、重复值和缺失值高于预设阈值的特征进行删除。
3.根据权利要求1所述的一种海洋环境预测模型的训练方法,其特征在于,所述运用灰色关联分析模型对预处理后的环境数据分析,获得数据集,具体包括如下步骤:
提取海洋环境数据评价指标,确定变量参数序列和变量比较序列;
将变量参数序列和变量比较序列进行归一化处理;
基于处理后的变量参数序列和变量比较序列,计算评价指标的关联系数;
将海洋环境数据的变量参数序列和变量比较序列在各个时刻的评价指标的关联系数求平均值,获得评价指标间的关联度;
将评价指标间的关联度进行排序,基于排序结果确定评价指标之间的相关性,生成数据集。
4.根据权利要求1所述的一种海洋环境预测模型的训练方法,其特征在于,采用ConvE模型构建时序知识图谱模型,具体包括如下
对实体和关系进行向量映射,获得实体嵌入矩阵和关系嵌入矩阵;
将关系嵌入矩阵中的每个元素放在对角线上进行变换,获得关系矩阵;
基于实体嵌入矩阵和关系矩阵,获得实体关系复合矩阵W,如下式:
式中,Mr关系矩阵,de是实体嵌入的维度,dr是关系嵌入的维度,dk是卷积核的数量;
对实体关系复合矩阵进行卷积处理,对卷积运算后的结果逐特征层进行非线性激活处理,提取时序知识图谱中实体和关系间向量化表示;
通过softmat函数,输出预测结果。
5.根据权利要求1所述的一种海洋环境预测模型的训练方法,其特征在于,通过HiSMatch历史结构匹配模型进行深层学习,对所述预测模型进行优化,所述HiSMatch历史结构匹配模型架构为:
通过时序知识图谱提取链路的特征向量:Fi=[f1,f2,...,fn]T式中,Fi是第i个链路的特征向量,f1到fn是n个特征值;
将特征向量和历史链路数据作为输入,利用GRU模型进行链路预测,如下:
pi=σ(Wp[hi-1,Fi]+bp)
式中,pi是第i个链路的预测概率,σ是sigmoid函数,Wp和bp是模型参数,hi-1是前一个时间步的隐藏状态。
6.根据权利要求1所述的一种海洋环境预测模型的训练方法,其特征在于,所述预测模型采用交叉熵损失函数,如下:
其中,L是损失函数,yi是第i个链路的真实标签,m是链路的数量。
7.根据权利要求1所述的一种海洋环境预测模型的训练方法,其特征在于,所述评估包括误差分析和准确率分析。
8.一种海洋环境预测模型的训练装置,其特征在于,包括:数据采集模块、灰色关联分析模块、建立时序知识图谱模块、数据预测模块和模型评估和调整模块,其中,
所述数据采集模块,用于获取海洋环境数据并进行预处理;
所述灰色关联分析模块,用于运用灰色关联分析模型对预处理后的环境数据分析,获得数据集;
所述建立时序知识图谱模块,用于将数据集输入构建的时序知识图谱模型进行训练,以预测时序知识图谱中实体之间的关系,生成预测模型;
所述数据预测模块,用于按照预测目标的时序信息,使用已训练好的知识图谱预测模型,通过预测目标实体与其他实体之间的前后依赖关系,对海洋环境检测领域时序知识图谱进行链路预测;
所述模型评估和调整模块,用于对链路预测的结果进行评估,基于评估结果对灰色关联分析模型和时序知识图谱预测模型进行优化和调整。
9.一种计算机设备,其特征在于,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310601024.1A CN116882538B (zh) | 2023-05-26 | 2023-05-26 | 一种海洋环境预测模型的训练方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310601024.1A CN116882538B (zh) | 2023-05-26 | 2023-05-26 | 一种海洋环境预测模型的训练方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116882538A true CN116882538A (zh) | 2023-10-13 |
CN116882538B CN116882538B (zh) | 2024-03-05 |
Family
ID=88255672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310601024.1A Active CN116882538B (zh) | 2023-05-26 | 2023-05-26 | 一种海洋环境预测模型的训练方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116882538B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118570739A (zh) * | 2024-08-02 | 2024-08-30 | 自然资源部第二海洋研究所 | 一种海洋环境质量评价方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112966053A (zh) * | 2020-09-18 | 2021-06-15 | 青岛海洋科学与技术国家实验室发展中心 | 一种基于知识图谱的海洋领域专家库构建方法及装置 |
US20210303792A1 (en) * | 2020-03-25 | 2021-09-30 | Nedim Lipka | Content analysis utilizing general knowledge base |
CN113535972A (zh) * | 2021-06-07 | 2021-10-22 | 吉林大学 | 一种融合上下文语义的知识图谱链路预测模型、方法及装置 |
CN115545300A (zh) * | 2022-09-30 | 2022-12-30 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 一种基于图神经网络进行用户行为预测的方法及装置 |
CN115544262A (zh) * | 2022-06-30 | 2022-12-30 | 中国人民解放军战略支援部队信息工程大学 | 一种地缘环境知识图谱构建方法 |
WO2023051400A1 (zh) * | 2021-09-29 | 2023-04-06 | 浙江大学 | 一种可微的挖掘常量规则的方法 |
CN115994683A (zh) * | 2022-05-20 | 2023-04-21 | 浙江中易慧能科技有限公司 | 一种基于知识图谱与迁移学习的企业安全风险预测方法 |
-
2023
- 2023-05-26 CN CN202310601024.1A patent/CN116882538B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210303792A1 (en) * | 2020-03-25 | 2021-09-30 | Nedim Lipka | Content analysis utilizing general knowledge base |
CN112966053A (zh) * | 2020-09-18 | 2021-06-15 | 青岛海洋科学与技术国家实验室发展中心 | 一种基于知识图谱的海洋领域专家库构建方法及装置 |
CN113535972A (zh) * | 2021-06-07 | 2021-10-22 | 吉林大学 | 一种融合上下文语义的知识图谱链路预测模型、方法及装置 |
WO2023051400A1 (zh) * | 2021-09-29 | 2023-04-06 | 浙江大学 | 一种可微的挖掘常量规则的方法 |
CN115994683A (zh) * | 2022-05-20 | 2023-04-21 | 浙江中易慧能科技有限公司 | 一种基于知识图谱与迁移学习的企业安全风险预测方法 |
CN115544262A (zh) * | 2022-06-30 | 2022-12-30 | 中国人民解放军战略支援部队信息工程大学 | 一种地缘环境知识图谱构建方法 |
CN115545300A (zh) * | 2022-09-30 | 2022-12-30 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 一种基于图神经网络进行用户行为预测的方法及装置 |
Non-Patent Citations (2)
Title |
---|
ZIXUAN LI: "HiSMatch: Historical Structure Matching based Temporal Knowledge Graph Reasoning", 《ARXIV》 * |
陈源毅 等: "基于知识图谱的行为路径协同过滤推荐算法", 《计算机科学》, pages 176 - 183 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118570739A (zh) * | 2024-08-02 | 2024-08-30 | 自然资源部第二海洋研究所 | 一种海洋环境质量评价方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116882538B (zh) | 2024-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Learning graph structures with transformer for multivariate time-series anomaly detection in IoT | |
Ma et al. | A hybrid attention-based deep learning approach for wind power prediction | |
Chang et al. | Efficient temporal flow Transformer accompanied with multi-head probsparse self-attention mechanism for remaining useful life prognostics | |
Du et al. | Missing data problem in the monitoring system: A review | |
Ayodeji et al. | Causal augmented ConvNet: A temporal memory dilated convolution model for long-sequence time series prediction | |
Dhevi | Imputing missing values using Inverse Distance Weighted Interpolation for time series data | |
Ma et al. | Degradation prognosis for proton exchange membrane fuel cell based on hybrid transfer learning and intercell differences | |
CN108876044B (zh) | 一种基于知识增强神经网络的线上内容流行度预测方法 | |
CN116882538B (zh) | 一种海洋环境预测模型的训练方法及相关装置 | |
Fu et al. | MCA-DTCN: A novel dual-task temporal convolutional network with multi-channel attention for first prediction time detection and remaining useful life prediction | |
CN115983087A (zh) | 一种注意力机制与lstm结合检测时序数据异常方法及终端机 | |
CN111222689A (zh) | 基于多尺度时间特征的lstm负荷预测方法、介质及电子装置 | |
CN113988357A (zh) | 基于深度学习的高层建筑风致响应预测方法及装置 | |
CN116822374A (zh) | 一种风速多步预测方法、装置、计算机设备和存储介质 | |
CN117198421A (zh) | 海洋环境智能探测系统及其方法 | |
Mao et al. | Tensor representation-based transferability analytics and selective transfer learning of prognostic knowledge for remaining useful life prediction across machines | |
Ma et al. | Prediction of remaining useful life of rolling bearings based on multiscale efficient channel attention CNN and bidirectional GRU | |
Fargalla et al. | TimeNet: Time2Vec attention-based CNN-BiGRU neural network for predicting production in shale and sandstone gas reservoirs | |
CN117874673A (zh) | 一种异常数据检测、解释方法 | |
CN117251813A (zh) | 一种网络流量异常检测方法和系统 | |
Chen et al. | Reinforced convolutional neural network fault diagnosis of industrial production systems | |
Mou et al. | Enhanced industrial process modeling with transfer-incremental-learning: A parallel SAE approach and its application to a sulfur recovery unit | |
CN115217152A (zh) | 一种沉管隧道管节接头张合变形的预测方法及装置 | |
Agrell et al. | Pitfalls of machine learning for tail events in high risk environments | |
Liu et al. | A Multi-channel Long-term External Attention Network for Aeroengine Remaining Useful Life Prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |