CN116306931B - 一种应用工业领域的知识图谱构建方法 - Google Patents
一种应用工业领域的知识图谱构建方法 Download PDFInfo
- Publication number
- CN116306931B CN116306931B CN202310586705.5A CN202310586705A CN116306931B CN 116306931 B CN116306931 B CN 116306931B CN 202310586705 A CN202310586705 A CN 202310586705A CN 116306931 B CN116306931 B CN 116306931B
- Authority
- CN
- China
- Prior art keywords
- data
- value
- abnormal
- abnormal value
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims abstract description 32
- 230000002159 abnormal effect Effects 0.000 claims abstract description 212
- 238000000034 method Methods 0.000 claims abstract description 67
- 230000035772 mutation Effects 0.000 claims abstract description 26
- 238000012216 screening Methods 0.000 claims abstract description 23
- 238000000556 factor analysis Methods 0.000 claims abstract description 18
- 239000013598 vector Substances 0.000 claims description 35
- 230000008569 process Effects 0.000 claims description 34
- 230000005856 abnormality Effects 0.000 claims description 29
- 238000000354 decomposition reaction Methods 0.000 claims description 18
- 238000003466 welding Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 abstract description 8
- 230000006872 improvement Effects 0.000 abstract description 3
- 230000009467 reduction Effects 0.000 abstract description 3
- 230000000694 effects Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 230000001788 irregular Effects 0.000 description 3
- 238000005299 abrasion Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000013021 overheating Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及电数字数据处理技术领域,具体涉及一种应用工业领域的知识图谱构建方法,该方法获取每种工业数据组成的数据序列并得到对应的残差序列,基于残差序列中残差值的大小筛选出数据序列中的异常值;获取异常值的异常值序列及其预测数据,通过异常值与预测数据的差异获取对应异常值的预测偏差;将相同的异常值归为一类,通过对每类异常值对应的所有异常值序列进行因子分析获取该类异常值的数据一致性;基于每个异常值对应的预测偏差和数据一致性获取突变概率,根据突变概率筛选外界影响造成的异常值并进行插值处理,对处理后的数据序列进行知识图谱的构建。能够构建更加符合实际的知识图谱,为后续提高生产效率、降低成本提供了数据支撑。
Description
技术领域
本发明涉及电数字数据处理技术领域,具体涉及一种应用工业领域的知识图谱构建方法。
背景技术
知识图谱的构建有助于提高生产效率、降低成本、改善产品质量和服务体验等方面。
具体地,工业领域知识图谱的构建,具有以下作用:
1)知识管理:工业领域涉及复杂的技术和流程,知识图谱可以帮助企业有效地管理和组织这些知识。通过将各种实体、属性、关系等元素抽象成节点和边,实现对关键信息的抽取和描述,让信息变得可视化,易于操作和使用。
2)智能推荐:基于知识图谱生成的语义关联性,可以实现智能化推荐,提升企业的决策效率。例如,在生产过程中,根据设备状态、产品需求等因素,系统可以自动优化生产计划和调度,避免资源浪费和延误。
3)问题解答:知识图谱还可以作为一个问答系统,快速回答用户的问题。比如,对于工艺路线或配方制定中的问题,系统可以依靠知识图谱中的领域知识,自动生成答案和解决方案。
4)智能化决策:知识图谱是企业决策支持系统的重要组成部分。通过整合海量数据和多源信息,可为领导层提供更加全面和准确的决策依据,以实现智能化决策和管理。
而在构建工业领域的知识图谱时,首先要对构建知识图谱的数据进行异常检测,对所有的异常数据通过插值替换的方法进行数据清洗,但知识图谱的构建往往是为了之后的数字孪生模型的构建,而数字孪生模型构建过程中需要保留实际的运行过程中的数据,其中系统运行过程中本身的异常数据同样也需要保留,用于使模型学习不同的设置参数,以得到与实际工业中更加相近的模型反应,从而可以令数字孪生模型精确模拟实际中参数可能带来的效果。
现有的这种数据清洗方法,容易将系统自我运行过程中产生的非外界影响的异常数据剔除,实则这些异常数据是数字孪生模型需要保留的数据,即现有的异常数据检测方法会将系统运行过程中非外界影响的异常数据清除,导致后续的知识图谱构建不精确,后续就无法实现对工业某领域的关键信息的准确的管理、推荐又或者是决策的问题。
发明内容
为了解决由于知识图谱构建不精确,导致后续的工业领域的关键信息无法准确的管理、推荐或者决策的问题,本发明提供一种应用工业领域的知识图谱构建方法,所采用的技术方案具体如下:
本发明一个实施例提供了一种应用工业领域的知识图谱构建方法,该方法包括以下步骤:
在连续时长下获取不同种类的工业数据,每种工业数据组成一个数据序列;通过对每个数据序列进行STL分解得到对应的残差序列,基于残差序列中残差值的大小筛选出数据序列中的异常值;所述工业数据包括激光焊接中的激光功率、扫描速度和焊接距离;选取每个异常值之前的预设数量的工业数据组成该异常值的异常值序列,获取异常值序列的预测数据,通过异常值与预测数据的差异获取对应异常值的预测偏差;
将相同的异常值归为一类,通过对每类异常值对应的所有异常值序列进行因子分析获取该类异常值的数据一致性;
基于每个异常值对应的预测偏差和数据一致性获取突变概率,根据突变概率筛选外界影响造成的异常值并进行插值处理,对处理后的数据序列进行知识图谱的构建。
进一步的,所述异常值的筛选过程为:
通过统计残差序列中的所有残差值的频次获取残差值直方图,通过阈值分割获取残差值直方图的残差阈值,将大于残差阈值的残差值对应的工业数据筛选为异常值。
进一步的,所述预测数据的获取过程为:
通过对异常值序列进行SSA分解获取的重构成分中的非异常值和异常值分别赋予权重,获取对应的相似度,基于利用所述相似度的SSA分解方法获取对应的预测数据。
进一步的,所述对异常值序列进行SSA分解获取的重构成分中的非异常值和异常值分别赋予权重,包括:
获取每个异常值的异常程度,对于每个重构成分,将其中的非异常值的初始权重均设置为预设值,将其中的异常值的初始权重设置为对应的异常程度与预设值的和,通过对首个重构成分的所有初始权重进行和为1的归一化,作为对应数据的权重。
进一步的,所述异常程度的获取方法为:
获取最大残差值,将每个异常值对应的残差值与所述最大残差值的比值作为对应异常值的所述异常程度。
进一步的,所述预测偏差的获取方法为:
计算异常值与预测数据的差值绝对值,获取异常值与预测数据之间的较大值,以该差值绝对值与该较大值之间的比值作为所述预测偏差。
进一步的,所述数据一致性的获取方法为:
将每类异常值对应的所有异常值序列作为因子分析的输入,得到第一公共因子向量;获取所有异常值序列的均值向量,以所有异常值序列的数量的均值向量作为因子分析的输入,获取第二公共因子向量,计算第一公共因子向量和第二公共因子向量的余弦相似度作为所述数据一致性。
进一步的,所述突变概率的获取方法为:
以每个异常值对应的预测偏差和数据一致性的比值作为对应的所述突变概率。
进一步的,所述外界影响造成的异常值的筛选过程为:
预设筛选阈值,当所述突变概率大于所述筛选阈值时,对应的异常值为外界影响造成的异常值。
进一步的,所述对处理后的数据序列进行知识图谱的构建,包括:
将处理后的数据序列输入TransR模型,构建对应的知识图谱。
本发明实施例至少具有如下有益效果:
本发明针对激光焊接中的激光功率、扫描速度和焊接距离的数据进行数据分析,构建知识图谱;具体地,通过将每种连续时长下的激光焊接工业数据组成数据序列,并基于数据序列STL分解得到的残差序列筛选异常值,残差序列为STL分解后数据中不规律的部分,工业数据往往是有规律的周期性数据,因此通过残差序列筛选出工业数据中不规律的异常值;通过残差序列筛选出的异常值可能是系统运行过程中系统本身产生的异常,也可能是受到外界影响导致的异常,若是系统本身产生的异常,则异常值之前的数据存在向该异常值变化的趋势,即利用异常值之前的数据能够预测到该异常值,因此获取异常值序列并获取对应的预测数据,获取预测数据与该异常值之间的预测偏差;若是系统本身产生的异常,多个相同异常值之间存在较大共性,甚至是规律性出现的,因此通过对相同异常值对应的异常值序列进行因子分析获取数据一致性;对于构建知识图谱之后,数字孪生模型的构建过程,需要系统本身产生的异常值作为学习的数据,因此通过预测偏差和数据一致性获取突变概率,筛选出由外界影响造成的异常值,将其进行插值处理,再构建处理后的数据序列的知识图谱。通过只对外界影响造成的异常值进行插值处理,保留系统本身造成的异常值,能够构建更加符合实际工作情况的知识图谱,与实际模型的贴合度更高,提高知识图谱构建的精准度,从而进一步提高了后续中的激光焊接过程中的数据的知识管理、推荐又或者是决策的准确性,也即能够对工业仪器的性能进行准确的掌握,从而为后续的提高生产效率、降低生产成本提供了准确的数据支撑。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例提供的一种应用工业领域的知识图谱构建方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种应用工业领域的知识图谱构建方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种应用工业领域的知识图谱构建方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种应用工业领域的知识图谱构建方法的步骤流程图,该方法包括以下步骤:
步骤S001,在连续时长下获取不同种类的工业数据,每种工业数据组成一个数据序列;通过对每个数据序列进行STL分解得到对应的残差序列,基于残差序列中残差值的大小筛选出数据序列中的异常值。
对工业中的知识图谱进行构建,首先需要获得不同种类的工业数据,获取时间上连续的每种工业数据的时序数据,组成数据序列,工业数据多种多样,例如:激光焊接过程中的速度数据,获取需要进行知识图谱构建的工业数据即可,后续对每种工业数据的数据序列进行分析。
需要说明的是,上述中的工业数据为激光焊接中的激光功率、扫描速度、焊接距离等数据;而本发明中指出的异常则是包括本身机器的异常,本身存在磨损,导致的周期性的异常,也包括外界导致的异常,例如:外界震动,导致的扫描速度或焊接距离的异常;本发明是对机器本身异常和外界导致的异常进行区分,避免知识图谱构建过程中将机器运行过程中的本身异常(例如:激光大功率时间较长,导致实际功率与显示功率的差异)排除的目的,避免构建的知识图谱精度不够高,从而导致后续的数据的分析不准确的问题,无法对工业仪器的性能进行准确的掌握,无法为后续的提高生产效率、降低生产成本提供了准确的数据支撑。
STL是一种对序列进行分析的方法,将序列分为趋势曲线、季节曲线和残差的过程,其中趋势曲线表示的是数据的整体变化趋势、季节曲线表示的是数据的周期性质,残差表示的是数据中的不规律的部分;而工业中的数据往往是周期性的、有规律的,例如:激光切割中的速度参数,在对一个模型进行反复切割获得多个同一模型过程中,速度参数的变化往往呈现周期性的变化,因此可以用残差表示速度变化过程中的异常,残差越大,数据异常性越大。
通过对每个数据序列进行STL分解得到对应的残差序列,通过残差序列得到的异常可能是系统运行过程中的系统本身产生的异常,也可能是受到外界影响导致的异常。如果是系统运行过程中的系统本身异常,该异常数据需要保留,便于构建知识图谱,进而构建孪生模型,使得孪生模型可以学习到系统运行过程中的异常数据,对真实情况进行更好的模拟。
系统运行过程中的系统本身异常是指,例如:系统运行一段时间后系统过热导致的数据与之前的数据产生较大偏差,但该偏差是可以通过之前的数据预测得到的,即之前的数据有向该数据变化的趋势;但如果是由于外界影响导致的异常数据,突变性较强,难以通过之前的数据对该数据进行预测。
通过统计残差序列中的所有残差值的频次获取残差值直方图,通过阈值分割获取残差值直方图的残差阈值,将大于残差阈值的残差值对应的工业数据筛选为异常值。
作为一个示例,在本发明实施例中阈值分割方法为otsu阈值分割方法,通过该方法获取残差阈值k,残差越大,数据异常性越大,当残差值大于残差阈值时,说明对应的工业数据异常的可能性较大,将其筛选为异常值。
需要说明的是,现有技术中存在较多阈值分割的方法,在其他实施例中还可以采用其他能够达到相同效果的阈值分割方法。
步骤S002,选取每个异常值之前的预设数量的工业数据组成该异常值的异常值序列,获取异常值序列的预测数据,通过异常值与预测数据的差异获取对应异常值的预测偏差。
由于系统运行过程中的系统本身异常可以通过之前的数据预测得到,外界影响导致的异常数据,突变性较强,难以通过之前的数据对该数据进行预测,因此可以通过异常数据之间的数据对该数据进行预测,通过预测结果的偏差和预测过程中的数据的分析对异常数据是系统本身异常还是外界影响的异常进行判定,进而决定对数据的不同处理方式,然后根据处理后的数据构建知识图谱。
在本发明实施例中预设数量为100,即对于每个异常值,将异常值之前的100个工业数据,例如,第a个工业数据为异常值,则第a个工业数据的异常值序列。
对异常值序列A进行SSA分解,传统的方法为:
(1)首先异常值序列A的长度为N,要预测的长度为M,则将异常值序列A的长度延长到N+M,将延伸出的部分暂用0代替;
(2)对异常值序列A进行SSA分解,得到多个重构成分(RC),用第一个重构成分(RC1)的[N+1,N+M]项替换掉异常值序列A的[N+1,N+M]项,然后对新的异常值序列A进行SSA分解,不断迭代上述过程,直到前后两次得到的RC1的RMS小于阈值,停止迭代;
(3)在第(2)步得到的结果的基础上添加RC2,并不断执行以上过程,最终将要重构的成分添加完毕,则此过程结束,得到的新序列的最后M个值就是预测值。
由于异常值的出现往往是系统本身的原因或外界影响导致的,异常导致的影响不可能马上消除,总要持续一段时间,例如机器过热的时候,采用相应措施,但异常值不可能马上消失,需要一段时间才能消失,因此异常值出现时往往是一个连续时间段的多个异常值,同时采取的措施往往会使得每个异常值的异常程度逐渐减小,例如:通过减小速度来防止过热,则同一个连续时间段的不同时刻的异常程度不同。
传统方法进行预测时,迭代停止条件是:前后两次的RC1的RMS小于阈值,即计算前后两次的RC1的相似度,该方法中将异常数据和非异常数据同等对待计算相似度,但由于重构成分(RC1)的[N+1,N+M]项之前的数据的规律性较强,为非异常数据,因此前后两次的RC1中这部分数据的相似性往往较大,现在应该更加关注的是[N+1,N+M]项数据的相似性,因此在相似性计算过程中在整体相似性不变的前提下,需要对[N+1,N+M]项数据分配更多的权重,即要求这部分数据的相似度较大才停止迭代,此时计算得到的数据是对异常数据的较大程度的预测,如果预测结果的偏差值较大,可以更真实地表示预测难度,即数据突变性较大,异常值大概率是由于外界影响导致的,从而之前数据难以对后续的该部分异常值进行预测。
基于此,本发明对SSA分解的过程进行改进:通过对异常值序列进行SSA分解获取的重构成分中的非异常值和异常值分别赋予权重,获取对应的相似度,基于利用相似度的SSA分解方法获取对应的预测数据。
具体的,首先获取最大残差值,将每个异常值对应的残差值与最大残差值的比值作为对应异常值的异常程度。
对于每个重构成分,将其中的非异常值的初始权重均设置为预设值,将其中的异常值的初始权重设置为对应的异常程度与预设值的和,通过对首个重构成分的所有初始权重进行和为1的归一化,作为对应数据的权重。
在本发明实施例中预设值为1,即非异常值的初始权重均设置为1,异常值的初始权重设置为对应的异常程度与1的和,对于所有非异常值来说,权重值都相同,对于异常数据来说,异常程度越大,权重值越大。
得到前后两次的RC1后,计算相似度的方法为:计算非异常值部分序列的余弦相似度乘上对应的权重,计算每个异常值的相似度,乘上对应权重,将加权求和的结果作为两个RC1的相似度。其中异常值的相似度为对应的两个异常值中较小值与较大值的比值。
当相似度大于0.8时,停止迭代。本发明改进了SSA分解前后两次的RC1的相似度的计算过程,以令该相似度的计算更加关注异常值,进而获取异常值序列A的预测数据。
计算异常值与预测数据的差值绝对值,获取异常值与预测数据之间的较大值,以该差值绝对值与该较大值之间的比值作为预测偏差。
以第a个工业数据异常值为例,计算预测偏差:
;
其中,表示异常值/>的预测偏差,/>表示预测数据,/>表示在异常值和预测数据/>中选取最大值,/>表示最大值函数。
预测偏差是对异常值与预测数据的差值绝对值的归一化结果,预测数据与异常值之间的差异越大,说明预测结果与异常值之间偏差较大,异常值很可能并不是系统本身导致的,而是受外界影响突变的,反之说明异常值较大可能是系统本身导致的。
步骤S003,将相同的异常值归为一类,通过对每类异常值对应的所有异常值序列进行因子分析获取该类异常值的数据一致性。
如果异常值是系统自身运行过程中产生的,则该值具有周期性,即如果该值出现,往往之前的数据具备某种相同的性质,导致了该异常值的出现;如果异常值是由于外界影响产生的,则该值具有偶然性,即对于多个该值来说,不同时刻该值之前的数据不具备某种相同的性质。
因此通过将数据序列中相同的异常值归为一类,判断同一数值的异常值是否存在共性。将不同时刻的相同异常值作为一个类别,能够得到多个异常值类别,对于每个异常值类别中的异常值来说,数值相同,只是所对应的时刻不同。对于每个类别,类别中有多个不同时刻的相同异常值,每个异常值对应一个异常值序列,即每个异常值类别对应多个异常值序列。
因子分析是一种对多个输入数据的共性特征进行提取分析的方法,因子分析得到的公共因子向量可以表示多个输入数据的共性特征,因此通过因子分析的方法对多个相同异常值的异常值序列进行分析。
将每类异常值对应的所有异常值序列作为因子分析的输入,得到第一公共因子向量;获取所有异常值序列的均值向量,以所有异常值序列的数量的均值向量作为因子分析的输入,获取第二公共因子向量,计算第一公共因子向量和第二公共因子向量的余弦相似度作为数据一致性。
将每个异常值类别对应的S个异常值序列,作为因子分析的输入,得到公共因子向量,称之为第一公共因子向量,公共因子向量可以表示所有输入向量,即所有异常值序列的相同特征。
获取所有异常值序列的均值向量,即相同位置元素的均值作为均值向量中对应位置的元素值,S个异常值序列得到一个均值向量,通过对S个相同的均值向量进行因子分析,得到公共因子向量,称之为第二公共因子向量,通过对S个相同的均值向量进行因子分析将第一公共因子向量和第二公共因子向量量纲统一,此时计算第一公共因子向量和第二公共因子向量的余弦相似度作为数据一致性,用p2表示。
数据一致性表示的是不同时刻的相同异常值对应的异常值序列的共有特征,一致性越大,共有特征越大,对应异常值越可能是系统自身运行过程中产生的。
步骤S004,基于每个异常值对应的预测偏差和数据一致性获取突变概率,根据突变概率筛选外界影响造成的异常值并进行插值处理,对处理后的数据序列进行知识图谱的构建。
预测偏差的值越大,表示越难通过之前数据预测该异常数据,该异常数据越可能是由于外界影响产生的;同一类别中所有异常值的异常值序列的数据一致性越大,表示该值之前的数据越具备某种相同的性质,导致了该异常值的出现,该异常值越可能是系统自身运行过程中产生的。
因此,以每个异常值对应的预测偏差和数据一致性的比值作为对应的突变概率。预测偏差与突变概率呈正相关关系,而数据一致性与突变概率呈负相关关系,则突变概率表示异常值是受外界影响导致出现的概率,突变概率p越大,对应的异常值越有可能是受外界影响导致的。
预设筛选阈值p0,当突变概率大于筛选阈值p0时,对应的异常值为外界影响造成的异常值。作为一个示例,筛选阈值p0的取值为0.7,在其他实施例中还可以根据实际情况调整筛选概率的取值。
当突变概率p大于筛选阈值p0时,对应的异常值是由于外界影响出现的,对该异常值通过最邻近插值的方法得到插值数据对该数据进行替换,对于p小于或者等于p0的异常值不做处理,即对于系统自身运行过程中产生的异常值不做处理,依然保留。
将所有大于筛选阈值p0的突变概率对应的异常值处理后,得到不受外界影响的处理后的数据序列,将处理后的数据序列输入TransR模型,构建对应的知识图谱。
需要说明的是,构建知识图谱的模型较多,在本发明实施例中利用TransR模型进行构建,在其他实施例中还可以利用其它能够达到相同效果的模型构建知识图谱。
综上所述,本发明实施例在连续时长下获取不同种类的工业数据,每种工业数据组成一个数据序列;通过对每个数据序列进行STL分解得到对应的残差序列,基于残差序列中残差值的大小筛选出数据序列中的异常值;选取每个异常值之前的预设数量的工业数据组成该异常值的异常值序列,获取异常值序列的预测数据,通过异常值与预测数据的差异获取对应异常值的预测偏差;将相同的异常值归为一类,通过对每类异常值对应的所有异常值序列进行因子分析获取该类异常值的数据一致性;基于每个异常值对应的预测偏差和数据一致性获取突变概率,根据突变概率筛选外界影响造成的异常值并进行插值处理,对处理后的数据序列进行知识图谱的构建。能够构建更加符合实际工作情况的知识图谱,与实际模型的贴合度更高,提高知识图谱构建的精准度。
需要说明的是,本发明的构建的知识图谱,由于其精确度高,从而能够使得后续的知识管理、智能推荐、问题解答或者智能化决策更加准确,即有助于提高生产效率、降低成本、改善产品质量和服务体验等方面。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,均应包含在本申请的保护范围之内。
Claims (9)
1.一种应用工业领域的知识图谱构建方法,其特征在于,该方法包括以下步骤:
在连续时长下获取不同种类的工业数据,每种工业数据组成一个数据序列;通过对每个数据序列进行STL分解得到对应的残差序列,基于残差序列中残差值的大小筛选出数据序列中的异常值;所述工业数据包括激光焊接中的激光功率、扫描速度和焊接距离;
选取每个异常值之前的预设数量的工业数据组成该异常值的异常值序列,获取异常值序列的预测数据,通过异常值与预测数据的差异获取对应异常值的预测偏差;
将相同的异常值归为一类,通过对每类异常值对应的所有异常值序列进行因子分析获取该类异常值的数据一致性;
基于每个异常值对应的预测偏差和数据一致性获取突变概率,根据突变概率筛选外界影响造成的异常值并进行插值处理,对处理后的数据序列进行知识图谱的构建;
所述数据一致性的获取方法为:
将每类异常值对应的所有异常值序列作为因子分析的输入,得到第一公共因子向量;获取所有异常值序列的均值向量,以所有异常值序列的数量的均值向量作为因子分析的输入,获取第二公共因子向量,计算第一公共因子向量和第二公共因子向量的余弦相似度作为所述数据一致性。
2.根据权利要求1所述的一种应用工业领域的知识图谱构建方法,其特征在于,所述异常值的筛选过程为:
通过统计残差序列中的所有残差值的频次获取残差值直方图,通过阈值分割获取残差值直方图的残差阈值,将大于残差阈值的残差值对应的工业数据筛选为异常值。
3.根据权利要求1所述的一种应用工业领域的知识图谱构建方法,其特征在于,所述预测数据的获取过程为:
通过对异常值序列进行SSA分解获取的重构成分中的非异常值和异常值分别赋予权重,获取对应的相似度,基于利用所述相似度的SSA分解方法获取对应的预测数据;其中,SSA分解时,当所述相似度大于0.8时,停止迭代;
所述相似度的获取,包括:计算非异常值部分序列的余弦相似度乘上对应的权重,计算每个异常值的相似度乘上对应权重,将加权求和的结果作为两个第一个重构成分的相似度。
4.根据权利要求3所述的一种应用工业领域的知识图谱构建方法,其特征在于,所述对异常值序列进行SSA分解获取的重构成分中的非异常值和异常值分别赋予权重,包括:
获取每个异常值的异常程度,对于每个重构成分,将其中的非异常值的初始权重均设置为预设值,将其中的异常值的初始权重设置为对应的异常程度与预设值的和,通过对首个重构成分的所有初始权重进行和为1的归一化,作为对应数据的权重。
5.根据权利要求4所述的一种应用工业领域的知识图谱构建方法,其特征在于,所述异常程度的获取方法为:
获取最大残差值,将每个异常值对应的残差值与所述最大残差值的比值作为对应异常值的所述异常程度。
6.根据权利要求1所述的一种应用工业领域的知识图谱构建方法,其特征在于,所述预测偏差的获取方法为:
计算异常值与预测数据的差值绝对值,获取异常值与预测数据之间的较大值,以该差值绝对值与该较大值之间的比值作为所述预测偏差。
7.根据权利要求1所述的一种应用工业领域的知识图谱构建方法,其特征在于,所述突变概率的获取方法为:
以每个异常值对应的预测偏差和数据一致性的比值作为对应的所述突变概率。
8.根据权利要求1所述的一种应用工业领域的知识图谱构建方法,其特征在于,所述外界影响造成的异常值的筛选过程为:
预设筛选阈值,当所述突变概率大于所述筛选阈值时,对应的异常值为外界影响造成的异常值。
9.根据权利要求1所述的一种应用工业领域的知识图谱构建方法,其特征在于,所述对处理后的数据序列进行知识图谱的构建,包括:
将处理后的数据序列输入TransR模型,构建对应的知识图谱。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310586705.5A CN116306931B (zh) | 2023-05-24 | 2023-05-24 | 一种应用工业领域的知识图谱构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310586705.5A CN116306931B (zh) | 2023-05-24 | 2023-05-24 | 一种应用工业领域的知识图谱构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116306931A CN116306931A (zh) | 2023-06-23 |
CN116306931B true CN116306931B (zh) | 2023-08-04 |
Family
ID=86829114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310586705.5A Active CN116306931B (zh) | 2023-05-24 | 2023-05-24 | 一种应用工业领域的知识图谱构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116306931B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102880170A (zh) * | 2012-10-08 | 2013-01-16 | 南京航空航天大学 | 基于基线模型和贝叶斯因子的系统故障早期预警方法 |
CN110490496A (zh) * | 2019-06-19 | 2019-11-22 | 中南大学 | 一种基于分步约简筛选复杂工业过程中影响产品质量的敏感变量的方法 |
CN110705710A (zh) * | 2019-04-17 | 2020-01-17 | 中国石油大学(华东) | 一种基于知识图谱的工业故障分析专家系统 |
CN112131575A (zh) * | 2020-09-21 | 2020-12-25 | 北京理工大学 | 一种基于分类错误率和一致性预测的概念漂移检测方法 |
CN112631240A (zh) * | 2020-12-07 | 2021-04-09 | 中国人民解放军63920部队 | 航天器故障主动检测方法及装置 |
US11080127B1 (en) * | 2018-02-28 | 2021-08-03 | Arizona Public Service Company | Methods and apparatus for detection of process parameter anomalies |
CN113705839A (zh) * | 2021-09-13 | 2021-11-26 | 北京博瑞华通科技有限公司 | 一种燃料电池电堆的预测性维护方法以及维护系统 |
CN114598627A (zh) * | 2020-12-07 | 2022-06-07 | 中国石油化工股份有限公司 | 一种基于知识图谱的异常网络信息检测方法 |
CN115829422A (zh) * | 2023-02-21 | 2023-03-21 | 创银科技(南通)有限公司 | 基于大数据的工业设备运行异常状态识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190228296A1 (en) * | 2018-01-19 | 2019-07-25 | EMC IP Holding Company LLC | Significant events identifier for outlier root cause investigation |
-
2023
- 2023-05-24 CN CN202310586705.5A patent/CN116306931B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102880170A (zh) * | 2012-10-08 | 2013-01-16 | 南京航空航天大学 | 基于基线模型和贝叶斯因子的系统故障早期预警方法 |
US11080127B1 (en) * | 2018-02-28 | 2021-08-03 | Arizona Public Service Company | Methods and apparatus for detection of process parameter anomalies |
CN110705710A (zh) * | 2019-04-17 | 2020-01-17 | 中国石油大学(华东) | 一种基于知识图谱的工业故障分析专家系统 |
CN110490496A (zh) * | 2019-06-19 | 2019-11-22 | 中南大学 | 一种基于分步约简筛选复杂工业过程中影响产品质量的敏感变量的方法 |
CN112131575A (zh) * | 2020-09-21 | 2020-12-25 | 北京理工大学 | 一种基于分类错误率和一致性预测的概念漂移检测方法 |
CN112631240A (zh) * | 2020-12-07 | 2021-04-09 | 中国人民解放军63920部队 | 航天器故障主动检测方法及装置 |
CN114598627A (zh) * | 2020-12-07 | 2022-06-07 | 中国石油化工股份有限公司 | 一种基于知识图谱的异常网络信息检测方法 |
CN113705839A (zh) * | 2021-09-13 | 2021-11-26 | 北京博瑞华通科技有限公司 | 一种燃料电池电堆的预测性维护方法以及维护系统 |
CN115829422A (zh) * | 2023-02-21 | 2023-03-21 | 创银科技(南通)有限公司 | 基于大数据的工业设备运行异常状态识别方法 |
Non-Patent Citations (1)
Title |
---|
钢铁企业高炉煤气发生量异常数据检测;王红君;白鹏;赵辉;岳有军;;《化工自动化及仪表》(第6期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116306931A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9208209B1 (en) | Techniques for monitoring transformation techniques using control charts | |
US9280739B2 (en) | Computer implemented system for automating the generation of a business decision analytic model | |
CN115497272B (zh) | 一种基于数字化建造的工期智能化预警系统及方法 | |
CN112529053A (zh) | 一种服务器中时序数据短期预测方法及系统 | |
CN116306931B (zh) | 一种应用工业领域的知识图谱构建方法 | |
JP2023520066A (ja) | 産業用機械学習のためのデータ処理 | |
CN110740063B (zh) | 基于信号分解和周期特性的网络流量特征指标预测方法 | |
Smirnov | Intelligent decision support system for the control of complex technical systems | |
Papadopoulos et al. | Reliable Confidence Intervals for Software Effort Estimation. | |
Sultana et al. | Economic design of control chart using genetic algorithm and simulated annealing algorithm | |
CN112905845B (zh) | 离散智能制造应用的多源非结构化数据清洗方法 | |
Ling et al. | Maximum profit mining and its application in software development | |
CN113238908B (zh) | 一种服务器性能测试数据分析方法及相关装置 | |
US20220019918A1 (en) | Machine learning feature recommendation | |
Hoffman et al. | Online maintenance prioritization via Monte Carlo tree search and case-based reasoning | |
Arputhamary et al. | Performance Improved Holt-Winter's (PIHW) Prediction Algorithm for Big Data Environment | |
Zouari et al. | Towards an adaptive curation services composition based on machine learning | |
Smirnov et al. | Bayesian model for evaluating the pragmatic efficiency of an information system of technological control | |
CN110956675A (zh) | 技术成熟度曲线自动生成方法及装置 | |
WO2024065776A1 (en) | Method for data processing, apparatus for data processing, electronic device, and storage medium | |
Zhang et al. | A different method of fault feature extraction under noise disturbance and degradation trend estimation with system resilience for rolling bearings | |
Liu et al. | Product quality prediction based on integrated feature selection | |
CN117389788A (zh) | 一种大数据平台运维方法、装置、介质 | |
CN116048936A (zh) | 一种xai模型评价方法、装置、设备和存储介质 | |
Wang et al. | Forecast of Production Quantity of General-Purpose Parts Based on Customized Production |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |